511 - 《AI Tips(2)》
发布于 2025年1月13日
1、Gemini 2 Multimodal Live。之前没找到入口。Google 的多模态可以的,他会分析你屏幕上的内容,然后和你互动。不过,好像是 English Only。
参考:
https://x.com/ivanfioravanti/status/1875268612229099594
https://x.com/dr_cintas/status/1875573778065117534
2、Witsy。有文章扩写的能力,我用的 DeepSeek 的 API。
Witsy 是一款 BYOK(自带密钥)的 AI 应用程序,支持多个主流 AI 模型提供商。它的主要特点包括:1) 支持 OpenAI、Ollama、Anthropic、MistralAI 等多个模型,可以进行文字对话、图像识别和生成、文字转语音等功能;2) 提供 “Prompt Anywhere” 功能,让用户在任何应用程序中快速生成 AI 内容;3) 提供 AI 命令功能,可以对选中的文本快速执行预设的 AI 操作;4) 支持专家提示功能,可以让 AI 在特定领域发挥专长;5) 具备本地文件对话功能,能够理解并回答关于用户文档的问题;6) 提供语音识别和实时语音对话功能。使用 Witsy 需要用户提供相应服务商的 API 密钥,或者通过 Ollama 在本地运行免费模型。这是一个功能丰富的工具,适合需要在日常工作中集成 AI 功能的用户。
3、.cursorrule 里可以定义 tools。比如让他搜索 google 等,通过让他执行脚本来