自从3月以来 AI一天一个大新闻 最近正在搞点一人项目 在频道分享一下自己现在超高强度用模型的心得和不同模型适用的任务
先说结果,我自己用得最多的几个大模型: Google Gemini 2.0 Flash Thinking 01-21,Grok 3,Claude 3.7 Sonnet,还有 GPT 4o Mini
· Google Gemini 2.0 Flash Thinking 01-21
谷歌大善人,免费且超高限额,我最近才发现限额不是 400万 Token 每天而是每分钟……根本用不完
优点:代码能力超强,文案没有AI味,反应速度快,思维链不会过于冗长;目前被我接到了 Roo Code/Cline 狂奔
缺点:缺少工具和结构化输出的能力,上下文只有 100K,多轮对话记忆不够好
· Grok 3
Deepsearch 开箱即用,我用来做日常资料搜集,一定程度上替代了搜索引擎
优点:搜索结果质量很高
缺点:还没有 API,只能网页用
· Claude 3.7 Sonnet
能混合思考,文案代码能力超群,我接上了 Dify 来做高质量的知识库和客服机器人,并且接上 Continue.dev 帮我单文件改bug
优点:支持广泛,文件、图片、文档样样精通,超长上下文,记忆能力很好
缺点:贵(是我的缺点,不是它的缺点)
· GPT 4o Mini
经典模型了,一些不需要很复杂的工作能让它直接帮我做,结构化输出和翻译能力很好,在上面跑 Tool Calling 和 Vision
优点:超级便宜,狂跑不心疼
缺点:能力比不上最近出来的变种AI
其他一些用过但现在已经不怎么用的模型
· DeepSeek V3/R1 - 前一段时间很火,但服务太不稳定,响应时间长,能力也欠缺(不支持视觉&R1不支持工具)
· OpenAI o1/o3 - 能力比上不足比下有余,思维方面遇到了瓶颈,无论是成本还是质量都被Claude和Gemini超越
· LLaMa 3.1/3.2/3.3 - 之前在 DeepInfra 一直免费用,405B的模型文案能力非常无敌,英文用词严谨,但目前被 Gemini 2.0 系列超越
#一人项目 #大语言模型 #AI #LLM
先说结果,我自己用得最多的几个大模型: Google Gemini 2.0 Flash Thinking 01-21,Grok 3,Claude 3.7 Sonnet,还有 GPT 4o Mini
· Google Gemini 2.0 Flash Thinking 01-21
谷歌大善人,免费且超高限额,我最近才发现限额不是 400万 Token 每天而是每分钟……根本用不完
优点:代码能力超强,文案没有AI味,反应速度快,思维链不会过于冗长;目前被我接到了 Roo Code/Cline 狂奔
缺点:缺少工具和结构化输出的能力,上下文只有 100K,多轮对话记忆不够好
· Grok 3
Deepsearch 开箱即用,我用来做日常资料搜集,一定程度上替代了搜索引擎
优点:搜索结果质量很高
缺点:还没有 API,只能网页用
· Claude 3.7 Sonnet
能混合思考,文案代码能力超群,我接上了 Dify 来做高质量的知识库和客服机器人,并且接上 Continue.dev 帮我单文件改bug
优点:支持广泛,文件、图片、文档样样精通,超长上下文,记忆能力很好
缺点:贵(是我的缺点,不是它的缺点)
· GPT 4o Mini
经典模型了,一些不需要很复杂的工作能让它直接帮我做,结构化输出和翻译能力很好,在上面跑 Tool Calling 和 Vision
优点:超级便宜,狂跑不心疼
缺点:能力比不上最近出来的变种AI
其他一些用过但现在已经不怎么用的模型
· DeepSeek V3/R1 - 前一段时间很火,但服务太不稳定,响应时间长,能力也欠缺(不支持视觉&R1不支持工具)
· OpenAI o1/o3 - 能力比上不足比下有余,思维方面遇到了瓶颈,无论是成本还是质量都被Claude和Gemini超越
· LLaMa 3.1/3.2/3.3 - 之前在 DeepInfra 一直免费用,405B的模型文案能力非常无敌,英文用词严谨,但目前被 Gemini 2.0 系列超越
#一人项目 #大语言模型 #AI #LLM