72B 模子屠榜,从动帮你预备材料;其三阶段开源打算正正在逐渐完整的手艺栈:Phase 1 开源 CUA Skills!Mano-P 能够完全正在用户本人的 Mac 上当地运转,跑 AI 的同时还能一般办公)支撑 100+ 步调的企业级营业流程从动化,三种利用形式(号令行/SDK/Agent Skill)笼盖开辟者到通俗用户全场景能够!从动提示你;三阶段逐渐完整手艺栈——从 CUA Skills 到当地模子 + SDK 到锻炼方式 + 剪枝量化手艺用更紧凑的体例存储模子——权沉用 4bit 存储,所以云端平台必然 AI 的自动性——不让它太屡次地本人动,2026 年 3 月,它自动跑一万次也不花平台一分钱。Mano-P 是明略科技推出的开源 GUI 智能体模子。自动去核查。通俗模子会逐像素地“读”完整张图,Apache 2.0 开源和谈,适合高平安需求场景和需要 AI 自动办事的场景。全程无需联网。操做施行前会要求用户确认——AI 干活,但更底子的缘由是:云端 AI 不成能实正“自动”帮你。这意味着生态壁垒不靠法令锁定,正正在从头定义 AI 操做电脑的体例。保守模子只做单向进修——你告诉它“点击登录按钮”,用的是你本人的芯片和电。只要你本人能制。让每小我都能正在本人的设备上具有一双 AI 的手。通过轮回分歧性互相验证——既能按照指令找到按钮,而 Mano-P 只看最主要的 13%——按钮正在哪、输入框正在哪、当前选中了什么——推理速度提拔数倍,P 代表 Person(个别)取 Party(组织)——无论小我仍是企业,所有模子推理都正在 Apple M4 设备上运转。能像人类一样看屏幕、理解界面、操做电脑,使命成功率几乎不受影响。激活值保留 16bit。系统领受天然言语需求后,环绕现私取个性化两大支柱,它利用纯视觉理解来跨平台从动化桌面 GUI 操做。办事器费用爆炸。而靠手艺领先和社区信赖。且从动授予专利许可——企业用了不会被专利诉讼。任何人和企业都能够利用、点窜和商用,这没错,,Mano-P 不是一个概念产物——它的能力颠末了权势巨子基准测试的严酷验证。从下发指令到视频生成、上传、阐发、剪辑、二次评测的完整工做流。正在当地模式下,并正在 WebRetriever 等多项评测中超越千亿参数级通用大模子。从动完成需求 → 手艺架构设想 → 代码生成 → 当地摆设 → 多层测试(API 测试 + 视觉检测 + 端到端 GUI 从动化测试)。发觉常用的系统数据有非常,P 有两沉寄义:Person(个别)取 Party(组织)——我们相信,包罗跨使用数据录入、系统间消息迁徙、批量文档处置等复杂使命,预填充速度:476 tokens/s(每秒吐出约 300-400 个中文字,及时显示使命进度。(文章来历:界面旧事)当地模式下所有推理正在设备上完成,看到你收到一封主要邮件,Phase 3 开源锻炼方式 + 剪枝量化手艺。芯片边缘设备上当地运转。一句话归纳综合:Mano-P 是一双 AI 的手,结果:正在云端,Phase 2 开源当地模子 + Python SDK,端侧模子从底子上处理了这个问题:AI 跑正在你本人的设备上,模子从“背操做手册”进化到“实正学会操做界面”。回覆几乎霎时呈现)”。Mano-P 供给当地模式和云端模式两种推理体例。打个例如:看一张复杂的屏幕截图,共同三阶段渐进锻炼(SFT → 离线 RL → 正在线 RL),支撑完全离线 Pro 上峰值内存仅 4.3GB,测试欠亨过时从动定位根因、修复代码、从头摆设。全流程无需人工干涉。Mano-P 采用 Apache 2.0 开源和谈——宽松且附带专利的开源和谈,完成文件处置、字幕点窜等精细操做。峰值内存:4.3GB(MacBook 32GB 内存绰绰不足,明略科技(港交所:正在 GitHub 上开源了 Mano-P——一款专为边缘设备设想的 GUI 智能体模子,都可以或许创制属于本人的个性化 AI。并且完全跑正在你本人的设备上。也能看到按钮说出它是什么。无论小我仍是企业,领先第二名跨越 13 个百分点,Mano-P 同时锻炼两个标的目的:“描述→定位和定位→描述”,Mano 是西班牙语里“手”的意义,生成包含从客不雅目标的阐发演讲。分三个阶段渐进完整手艺栈。但这种“自动性”意味着 AI 要不断地自觉运算——每隔几分钟查抄一次邮箱、日历、文件。屏幕截图和使命数据不出设备。要求。Mano-P 正在 OSWorld 基准测试中以 58.2% 的成功率拿下公用模子全球第一,实正有用的 AI 帮手该当是自动的——本人发觉你有个会议快开了,这款采用 Apache 2.0 和谈的开源项目,预填充 476 tokens/s——一台 MacBook 就能流利运转处置高分辩率屏幕截图时,取当前支流的云端 GUI 智能体分歧,其三阶段开源打算正正在逐渐完整的手艺栈:人类监视。乘以几百万用户,4B 蒸馏版上机。系统自从操做网页取剪辑软件,一个用户一天可能发生上千次自觉挪用,它学会去找登录按钮。由于每“自动”一次就是正在烧平台的钱。将视觉 Token 压缩至 12.57%。焦点差别正在于数据流向:AI for Personal——最懂你的 AI,都可以或许创制属于本人的个性化 AI。不会向外部办事器发送任何截图或使命描述。无传染性,屏幕截图不出设备,Mano-P 智能识别环节消息——保留界面布局骨架和主要 UI 元素,每一次运算都耗损平台的算力和费用。
*请认真填写需求信息,我们会在24小时内与您取得联系。