AI工具全景 ― 了解4大类别
想试试AI工具时,首先遇到的难题就是"种类太多了,不知道该选哪个"。
别担心。截至2026年3月,主流AI工具大致可以分为4大类别。不需要全部记住,只需了解自己想做的事情属于哪个类别,选择工具就会轻松很多。
聊天AI(文本生成)
ChatGPT、Claude、Gemini等。文章撰写、摘要、翻译、数据分析、咨询等,是应用最广泛的类别。AI新手建议从这里开始。所有服务都有免费版,无需花钱就能体验。"AI到底能做什么?"这个疑问,试用聊天AI 5分钟就能得到答案。
图像生成AI
ChatGPT的图像生成功能、Midjourney、Stable Diffusion等。只需用文字描述"我想要这样的图片",就能生成照片级图像、插画甚至Logo。适合社交媒体内容和演示资料的图像制作。
编程AI
GitHub Copilot、Cursor、Codex(OpenAI)、Claude Code等。虽然是面向程序员的工具,但最近因为"零基础也能做App"而备受关注。从代码自动补全到能自主构建应用的AI代理,功能覆盖面很广。
AI搜索引擎
Perplexity、Gemini(搜索联动)、ChatGPT(浏览功能)等。与传统搜索引擎不同,它能跨多个网站进行调研,并附带出处生成回答。大幅提升了信息检索效率。
据Fortune Business Insights预测,全球AI市场在2026年将达到约5,145亿美元规模。不过,普通用户日常使用的工具主要集中在以上4个类别。即使觉得"选择太多了",只需根据自己的需求从对应类别中选一个就够了。
ChatGPT vs Claude vs Gemini ― 三大聊天AI的个性
在聊天AI中,用户最多的是ChatGPT、Claude和Gemini。你可能觉得"都差不多吧",但实际上它们各有鲜明的特点。可以想象成三个能力很强但擅长领域不同的同事。
ChatGPT ― 全能型多面手
OpenAI开发的产品,是引爆生成式AI热潮的先驱。自2022年11月发布以来,一直拥有最多用户。2025年周活跃用户超过7.5亿,在聊天AI市场占有约68%的份额(Similarweb,2026年1月)。
ChatGPT适合的场景:
- 第一次使用AI ― 信息量丰富,几乎任何问题都能给出回答
- 也想生成图片 ― 在对话中说"帮我生成这样的图片"是ChatGPT独有的优势
- 多种用途 ― 通过GPTs和插件可以扩展功能
价格方面,除免费版外,还有Go($8/月)、Plus($20/月)、Pro($200/月)(截至2026年3月)。免费版就能进行基本对话和图像生成(有次数限制),先从这里开始是最稳妥的选择。
Claude ― 思考力与文笔的专家
Anthropic开发的AI助手。以"有用、无害、诚实"为设计理念,专注于长文处理和逻辑思维。
Claude适合的场景:
- 长文写作与分析 ― 报告、论文、方案等,写长文选Claude更稳定
- 逻辑分析 ― 在复杂问题的整理和比较分析上,能给出条理清晰的回答
- 编程 ― 在编程能力基准测试中始终名列前茅。还提供Claude Code开发者工具
- 文档分析 ― 支持上传PDF和文本文件进行内容分析
价格为免费版、Pro($20/月)、Max($100/$200/月)。免费版虽有次数限制,但足以体验Claude的文字功力。如果你想"让AI写长文"或"让它深入思考",建议先试试Claude。
Gemini ― Google生态的王者
Google开发的AI,最大优势是与Google生态系统的深度整合。能和Gmail、Google文档、表格等联动使用,这是其他两款不具备的重大优势。
Gemini适合的场景:
- 查找最新信息 ― 与Google搜索联动最强,实时信息获取能力出色
- 经常使用Google服务 ― 在Gmail和Docs中直接使用AI的便利性体验后就回不去了
- 想分析视频内容 ― 还有总结YouTube视频内容的功能
价格为免费版、AI Pro($19.99/月)、Ultra(3个月$124.99,约$42/月)。免费额度相对充足,有Google账号就能立即开始使用。
到底该选哪个?
说实话,"全部试一遍,用最喜欢的"就是最优解。三个都可以免费试用,不用白不用。不过,如果想要一个明确的起点:
- 只选一个的话 → ChatGPT(相关资料最多,遇到问题最容易找到解答)
- 注重文字和分析 → Claude(长文的稳定性确实不同)
- Google重度用户 → Gemini(日常的Google工作直接被优化)
2026年的主流不是"只用一个",而是根据需求使用多个工具。文章用Claude写,搜索用Gemini ― 这样的用法越来越普遍。
免费版能做到什么程度?
"免费版是不是很快就会碰到限制?"很多人都有这个疑问。确实与付费版有差距,但2026年的免费版比你想象的要好用得多。
免费版能做的事
| 功能 | ChatGPT 免费版 | Claude 免费版 | Gemini 免费版 |
|---|---|---|---|
| 文本对话 | ◯(有次数限制) | ◯(有次数限制) | ◯(有次数限制) |
| 图像生成 | ◯(有限制) | ✕ | ◯(有限制) |
| 文件上传 | ◯ | ◯ | ◯ |
| 网络搜索 | ◯ | △(有限制) | ◯ |
| 可用模型 | 以GPT-4o mini为主 | Sonnet(中档) | 以Gemini Flash为主 |
| 次数参考 | 每天数十次 | 每天数十次 | 每天数十次 |
日常使用 ― 写邮件草稿、修改文章、简单查询 ― 免费版完全够用。
免费版就能完成这些 ― 5个实例
虽然说"免费可用",但可能还是不太清楚具体能做什么。以下是免费版就能完成的5个工作示例:
- 商务邮件草稿 ― 输入"帮我写一封因系统故障导致项目延期的道歉邮件,预计下周五恢复",就能生成一封得体的邮件
- 会议纪要整理 ― 粘贴笔记然后说"把这些整理成会议纪要格式,明确列出决议事项和待办任务"
- 翻译和回复英文邮件 ― 粘贴英文邮件说"翻译成中文,然后按这个意思帮我写一封回复"
- 演示文稿大纲 ― 告诉主题,说"帮我设计一个10分钟演示的幻灯片结构,每页写出要点"
- Excel公式咨询 ― "教我一个从A列日期自动提取星期几的公式"之类的小问题
这些都是任何服务的免费版都能胜任的工作。只是把日常的"有点麻烦的小事"交给AI,就能省下不少时间。
什么时候考虑升级付费版
出现以下情况时,就是升级付费版的时候了:
- "已达到使用限制"的提示频繁出现 ― 工作中大量使用时,免费额度会不够
- 想用最强模型 ― ChatGPT的GPT-4o/o3、Claude的Opus、Gemini的Ultra等。顶级模型的准确性和创造力更上一层楼
- 想大量生成图片 ― 免费版的次数限制不够用时
- 需要一次处理很长的文档 ― 付费版提供更长的上下文窗口(AI一次能读取的量)
- 团队使用 ― 企业版有团队管理和安全功能
价格对比 ― 每月多少钱起?
| 服务 | 免费 | 入门付费 | 标准付费 | 高级版 |
|---|---|---|---|---|
| ChatGPT | ◯ | Go $8/月 | Plus $20/月 | Pro $200/月 |
| Claude | ◯ | Pro $20/月 | Max $100/月 | Max $200/月 |
| Gemini | ◯ | AI Pro $19.99/月 | ― | Ultra ~$42/月 |
※ 截至2026年3月的价格。人民币金额因汇率波动而异。
关键是等到自己感受到"值得付费"时再升级。完全不需要急。先用免费版1-2周,了解自己的使用习惯后再决定。ChatGPT的Go计划($8/月)是"免费不够用但$20又太贵"的人的理想选择。
试试图像生成AI
第1章中我们了解了AI的种类,图像生成AI是2025-2026年进步最快的领域之一。只需输入"红屋顶小咖啡馆,雨天"这样的文字,就能生成对应场景的图像 ― 亲自体验时,你会惊讶于它的有趣。
新手首选ChatGPT的图像生成功能
如果是第一次尝试图像生成AI,最推荐ChatGPT的图像生成功能。原因很简单——"能边聊天边做图"。
例如:
- "帮我画一幅巴黎咖啡馆的水彩画风插画" → 生成图像
- "色调再暖一些" → 修改后的图像出来了
- "在露天座位上加一只猫" → 进一步修改
这种通过对话逐步接近理想图像的过程,比专业工具直观得多。2025年3月ChatGPT图像生成功能大幅升级后(GPT-4o原生图像生成),品质已经达到专业创作者认可的水平。
追求品质选Midjourney
Midjourney在"艺术性"方面独树一帜。独特的风格和精美的画面是它的魅力,不少专业设计师和插画师也在使用。月费$10起,可通过Web应用操作。使用"风格参考"功能,还能参考已有图片的风格来批量生成统一风格的图像。
但不支持像ChatGPT那样"边聊天边修改"。提示词的写法需要一些技巧,基本以英文指令为主。
追求自由度选Stable Diffusion
Stable Diffusion是开源的图像生成模型,安装在自己的电脑上就能免费无限量生成图像。还能用LoRA技术训练自定义风格。不过,需要一定的GPU(显卡)配置和技术知识。
最近ComfyUI和Forge UI等图形界面工具越来越完善,比以前更易上手。适合"不想花钱又想大量生成图片"或"想精细定制"的用户。
使用图像生成AI的注意事项
图像生成AI的进步令人瞩目,但也有需要注意的地方:
- 版权 ― 生成图像的版权因国家和服务而异。商业使用时请确认服务条款
- 虚假图像风险 ― 生成与真实人物相似的图像存在伦理问题。各服务都设有限制
- 训练数据问题 ― 用现有艺术家的作品进行训练一直受到批评
这些问题将在第5章"AI的风险与伦理"中详细讨论。
编程AI的世界
觉得"编程跟我没关系"的朋友,请稍等。编程AI的发展不仅与程序员相关,而是关乎所有职场人士。
因为有了编程AI,"没有编程经验也能做App"的时代已经来临。McKinsey调查(2024年)显示,引入编程AI的开发团队生产力最高提升了55%。
GitHub Copilot ― 编辑器中的搭档
GitHub和Microsoft提供的编程AI,也是使用最广泛的。在VS Code等代码编辑器中运行,在你写代码的过程中提示"接下来应该写的代码"。
例如,只要写了函数名,就能自动建议整个函数体;只写注释,就能生成对应的代码。价格为免费版(有限制)、个人版$10/月、企业版$19/月(截至2026年3月)。
Cursor ― AI优先的编辑器
Cursor是一款从零开始为"与AI协作"设计的代码编辑器。基于VS Code,但AI交互是编辑器的核心。只需用自然语言说"找出这个文件的Bug"或"添加这个功能",就能一次性对多个文件进行代码修改。
价格为免费版(有限制)、Pro $20/月、Business $40/月。在程序员中快速普及,在2025年Stack Overflow Developer Survey中也作为热门工具被提及。
Codex ― 云端自主编程代理
OpenAI在2025年5月发布的云端编程代理。给出任务指令后,它会在云端沙盒环境中自主编写代码、运行测试,完成后提交Pull Request(代码变更提案)。截至2026年3月,周活跃用户已超过200万人(OpenAI公布)。
包含在ChatGPT Plus($20/月)中,无需额外付费。特别适合"希望在后台推进工作"、"想把常规代码编写任务交出去"的场景。CLI工具也已开源。
Claude Code ― 在终端运行的AI工程师
Anthropic提供的开发者CLI工具。可以直接从终端向Claude提出编程需求,它能自主完成文件读写、Git操作、测试执行等。在SWE-bench(编程能力基准测试)中以80.9%的得分位列顶级。
与Codex在云端异步工作不同,Claude Code在本地环境中实时交互式工作。实际上,本站(AI Arte)就是用Claude Code开发的。Claude Pro($20/月)即可使用。
不会编程也能用AI
编程AI虽然是面向专业人士的工具,但聊天AI(ChatGPT、Claude、Gemini)也有强大的编程辅助功能。即使没有编程知识,也可以这样使用:
- 制作Excel宏 ― 说"帮我写一个按部门汇总月销售额的宏",就能得到直接复制粘贴使用的代码
- 制作网页 ― 说"帮我做一个简单的个人介绍页面的HTML和CSS",就能得到可以直接发布的页面
- 数据整理 ― 说"帮我写一个从这个CSV中只提取北京数据的Python脚本"
- 自动化脚本 ― 如"每天定时备份文件夹内文件的脚本"这样的日常任务自动化
也就是说,编程AI不仅仅是程序员的工具,而是对所有"想通过简单自动化让工作更轻松"的人都有价值。学会第3章的提示词技巧后,还能更有效地使用它。
想深入学习编程的朋友,也可以看看第6章关于AI代理的内容。编程AI是当前进化最快的领域。
按需选择 ― 用流程图找到适合的工具
读到这里觉得"信息量太大了"的朋友,我们准备了一个简单的流程图。来找找适合自己的工具吧。
推荐的入门方式
说实话,第一步最稳妥的选择是先试试ChatGPT。它是全能型的,聊天、图像生成、搜索、编程辅助,一个服务几乎覆盖所有用途。
然后如果觉得"想要更好的文字质量"就试Claude,"想要Google联动"就试Gemini,"想要带出处的调研"就试Perplexity ― 这样逐步扩展自己的工具库,是最无压力的方式。
别忘了AI搜索引擎
最后说一个容易被忽视的类别。以Perplexity为代表的AI搜索引擎,是能彻底改变信息检索效率的工具。
传统的Google搜索需要你一个一个打开搜索结果,自己汇总信息。AI搜索引擎能跨多个网站分析信息,生成附带出处的回答。只需问"告诉我关于XX的最新信息",它就能从学术论文到新闻报道全面调研后给出答案。
Perplexity免费版就很好用,建议试一试。你的调研体验会焕然一新。
总结 ― 比起完美选择,先动手更重要
本章介绍了4大类AI工具。回顾一下:
- 聊天AI(ChatGPT / Claude / Gemini)― 全能型,先从这里开始
- 图像生成AI(ChatGPT / Midjourney / Stable Diffusion)― 视觉内容制作
- 编程AI(Copilot / Cursor / Codex / Claude Code)― 提升开发效率
- AI搜索引擎(Perplexity / Gemini)― 大幅提升调研质量和速度
重要的是不要想着"找到最好的工具再开始"。每个工具都能在几分钟内上手,不合适就换一个。与其追求完美选择,不如先试用一个 ― 这才是活用AI的最短路径。
下一章将学习影响AI输出质量的关键因素 ―"提示词技巧"。无论选择什么工具,使用方法的不同都会让结果天差地别 ― 我们将深入探讨这个核心。
参考文献
- Similarweb / First Page Sage「AI Chatbot Market Share 2026」(2026年1月)
- Fortune Business Insights「Artificial Intelligence Market Size」(2026年,市场规模$5,145亿)
- McKinsey Global Institute「The State of AI: How organizations are rewiring to capture value」(2024年)
- Panto「AI Coding Assistant Statistics」(2025年,84%的开发者使用AI编程工具)
- 各服务官网: ChatGPT / Claude / Gemini / Perplexity