简介
Omi是一个开源AI助手,能实时捕捉你的屏幕内容和对话语音,自动转录、生成摘要和待办事项。支持桌面端、手机和可穿戴设备,GitHub上已有30万+用户。
说白了,它就是个过目不忘的数字秘书。
核心功能
- 全平台覆盖:macOS桌面、iOS/Android手机、专属可穿戴设备
- 实时语音转录:用Deepgram做语音识别,支持多人对话场景区分
- 屏幕内容捕捉:自动识别屏幕显示内容,理解上下文
- 智能记忆库:记住你所有对话和浏览内容,随时查询
- 自动生成待办:从对话中提取行动项
- 完全开源:MIT许可证,代码在GitHub,可以自己搭服务端
价格方案
| 方案 | 价格 | 功能限制 |
|---|---|---|
| 免费版 | ¥0 | 基础转录、对话摘要、AI聊天 |
| Pro版 | $19/月 | 无限转录、高级AI模型、优先支持 |
点击下方链接可享优惠 CPS链接:Omi官网 →
优缺点对比
| 优点 | 缺点 |
|---|---|
| 全平台支持,数据同步方便 | 免费版功能有限 |
| 完全开源,可以自己部署 | 语音识别依赖云服务 |
| AI记忆功能确实好用 | 刚上手需要花点时间 |
| 实时转录延迟很低 | macOS需要14以上系统 |
| 支持可穿戴设备 | 国内可能要代理 |
适合人群
推荐给开会多、需要记录大量信息的上班族,研究人员和学生,项目经理这类要跟踪多个项目的人。
不推荐对隐私特别敏感、不愿意数据上云的用户,或者不想花时间学新工具的人。
使用教程
下载安装:去 omi.me 下载客户端。macOS用户可以直接跑:
git clone https://github.com/BasedHardware/omi.git && cd omi/desktop && ./run.sh --yolo注册登录:邮箱或Google账号都行,第一次会引导你做基础设置
开始记录:点开始按钮,Omi自动捕捉屏幕和麦克风,实时转录
查询记忆:在AI聊天界面问就行,比如"上周三开会说的那个待办是什么"
管理待办:查看自动生成的行动项,可以标记完成或导出
技术架构
Omi用Swift/SwiftUI写macOS客户端,后端是Rust。移动端用Flutter。服务端是Python/FastAPI加Firebase。语音处理用Deepgram,AI模型支持多种LLM后端。
开发者可以用Python、Swift、React Native的SDK自己写应用。
购买建议
开会多的人,Pro版值得买。实时转录加AI记忆能省不少事,自动生成待办这个功能确实有用。
个人用户或轻度使用者,免费版够用了。开源社区挺活跃,有问题去Discord问一般能解决。
官方链接:Omi官网 →
GitHub:BasedHardware/omi
本文基于2026年4月GitHub Trending和官方文档整理。
