AI工具全景 ― 了解4大类别

想试试AI工具时,首先遇到的难题就是"种类太多了,不知道该选哪个"

别担心。截至2026年3月,主流AI工具大致可以分为4大类别。不需要全部记住,只需了解自己想做的事情属于哪个类别,选择工具就会轻松很多。

AI工具4大类别:聊天AI、图像生成AI、编程AI、AI搜索引擎

聊天AI(文本生成)

ChatGPT、Claude、Gemini等。文章撰写、摘要、翻译、数据分析、咨询等,是应用最广泛的类别。AI新手建议从这里开始。所有服务都有免费版,无需花钱就能体验。"AI到底能做什么?"这个疑问,试用聊天AI 5分钟就能得到答案。

图像生成AI

ChatGPT的图像生成功能、Midjourney、Stable Diffusion等。只需用文字描述"我想要这样的图片",就能生成照片级图像、插画甚至Logo。适合社交媒体内容和演示资料的图像制作。

编程AI

GitHub Copilot、Cursor、Codex(OpenAI)、Claude Code等。虽然是面向程序员的工具,但最近因为"零基础也能做App"而备受关注。从代码自动补全到能自主构建应用的AI代理,功能覆盖面很广。

AI搜索引擎

Perplexity、Gemini(搜索联动)、ChatGPT(浏览功能)等。与传统搜索引擎不同,它能跨多个网站进行调研,并附带出处生成回答。大幅提升了信息检索效率。

据Fortune Business Insights预测,全球AI市场在2026年将达到约5,145亿美元规模。不过,普通用户日常使用的工具主要集中在以上4个类别。即使觉得"选择太多了",只需根据自己的需求从对应类别中选一个就够了。

ChatGPT vs Claude vs Gemini ― 三大聊天AI的个性

在聊天AI中,用户最多的是ChatGPT、Claude和Gemini。你可能觉得"都差不多吧",但实际上它们各有鲜明的特点。可以想象成三个能力很强但擅长领域不同的同事。

ChatGPT、Claude、Gemini对比:擅长领域、注意事项、价格

ChatGPT ― 全能型多面手

OpenAI开发的产品,是引爆生成式AI热潮的先驱。自2022年11月发布以来,一直拥有最多用户。2025年周活跃用户超过7.5亿,在聊天AI市场占有约68%的份额(Similarweb,2026年1月)。

ChatGPT适合的场景:

  • 第一次使用AI ― 信息量丰富,几乎任何问题都能给出回答
  • 也想生成图片 ― 在对话中说"帮我生成这样的图片"是ChatGPT独有的优势
  • 多种用途 ― 通过GPTs和插件可以扩展功能

价格方面,除免费版外,还有Go($8/月)、Plus($20/月)、Pro($200/月)(截至2026年3月)。免费版就能进行基本对话和图像生成(有次数限制),先从这里开始是最稳妥的选择。

Claude ― 思考力与文笔的专家

Anthropic开发的AI助手。以"有用、无害、诚实"为设计理念,专注于长文处理和逻辑思维。

Claude适合的场景:

  • 长文写作与分析 ― 报告、论文、方案等,写长文选Claude更稳定
  • 逻辑分析 ― 在复杂问题的整理和比较分析上,能给出条理清晰的回答
  • 编程 ― 在编程能力基准测试中始终名列前茅。还提供Claude Code开发者工具
  • 文档分析 ― 支持上传PDF和文本文件进行内容分析

价格为免费版、Pro($20/月)、Max($100/$200/月)。免费版虽有次数限制,但足以体验Claude的文字功力。如果你想"让AI写长文"或"让它深入思考",建议先试试Claude。

Gemini ― Google生态的王者

Google开发的AI,最大优势是与Google生态系统的深度整合。能和Gmail、Google文档、表格等联动使用,这是其他两款不具备的重大优势。

Gemini适合的场景:

  • 查找最新信息 ― 与Google搜索联动最强,实时信息获取能力出色
  • 经常使用Google服务 ― 在Gmail和Docs中直接使用AI的便利性体验后就回不去了
  • 想分析视频内容 ― 还有总结YouTube视频内容的功能

价格为免费版、AI Pro($19.99/月)、Ultra(3个月$124.99,约$42/月)。免费额度相对充足,有Google账号就能立即开始使用。

到底该选哪个?

说实话,"全部试一遍,用最喜欢的"就是最优解。三个都可以免费试用,不用白不用。不过,如果想要一个明确的起点:

  • 只选一个的话 → ChatGPT(相关资料最多,遇到问题最容易找到解答)
  • 注重文字和分析 → Claude(长文的稳定性确实不同)
  • Google重度用户 → Gemini(日常的Google工作直接被优化)

2026年的主流不是"只用一个",而是根据需求使用多个工具。文章用Claude写,搜索用Gemini ― 这样的用法越来越普遍。

免费版能做到什么程度?

"免费版是不是很快就会碰到限制?"很多人都有这个疑问。确实与付费版有差距,但2026年的免费版比你想象的要好用得多

免费版能做的事

功能 ChatGPT 免费版 Claude 免费版 Gemini 免费版
文本对话 ◯(有次数限制) ◯(有次数限制) ◯(有次数限制)
图像生成 ◯(有限制) ◯(有限制)
文件上传
网络搜索 △(有限制)
可用模型 以GPT-4o mini为主 Sonnet(中档) 以Gemini Flash为主
次数参考 每天数十次 每天数十次 每天数十次

日常使用 ― 写邮件草稿、修改文章、简单查询 ― 免费版完全够用。

免费版就能完成这些 ― 5个实例

虽然说"免费可用",但可能还是不太清楚具体能做什么。以下是免费版就能完成的5个工作示例:

  1. 商务邮件草稿 ― 输入"帮我写一封因系统故障导致项目延期的道歉邮件,预计下周五恢复",就能生成一封得体的邮件
  2. 会议纪要整理 ― 粘贴笔记然后说"把这些整理成会议纪要格式,明确列出决议事项和待办任务"
  3. 翻译和回复英文邮件 ― 粘贴英文邮件说"翻译成中文,然后按这个意思帮我写一封回复"
  4. 演示文稿大纲 ― 告诉主题,说"帮我设计一个10分钟演示的幻灯片结构,每页写出要点"
  5. Excel公式咨询 ― "教我一个从A列日期自动提取星期几的公式"之类的小问题

这些都是任何服务的免费版都能胜任的工作。只是把日常的"有点麻烦的小事"交给AI,就能省下不少时间。

什么时候考虑升级付费版

出现以下情况时,就是升级付费版的时候了:

  • "已达到使用限制"的提示频繁出现 ― 工作中大量使用时,免费额度会不够
  • 想用最强模型 ― ChatGPT的GPT-4o/o3、Claude的Opus、Gemini的Ultra等。顶级模型的准确性和创造力更上一层楼
  • 想大量生成图片 ― 免费版的次数限制不够用时
  • 需要一次处理很长的文档 ― 付费版提供更长的上下文窗口(AI一次能读取的量)
  • 团队使用 ― 企业版有团队管理和安全功能

价格对比 ― 每月多少钱起?

服务 免费 入门付费 标准付费 高级版
ChatGPT Go $8/月 Plus $20/月 Pro $200/月
Claude Pro $20/月 Max $100/月 Max $200/月
Gemini AI Pro $19.99/月 Ultra ~$42/月

※ 截至2026年3月的价格。人民币金额因汇率波动而异。

关键是等到自己感受到"值得付费"时再升级。完全不需要急。先用免费版1-2周,了解自己的使用习惯后再决定。ChatGPT的Go计划($8/月)是"免费不够用但$20又太贵"的人的理想选择。

试试图像生成AI

第1章中我们了解了AI的种类,图像生成AI是2025-2026年进步最快的领域之一。只需输入"红屋顶小咖啡馆,雨天"这样的文字,就能生成对应场景的图像 ― 亲自体验时,你会惊讶于它的有趣。

图像生成AI三大选择:ChatGPT、Midjourney、Stable Diffusion

新手首选ChatGPT的图像生成功能

如果是第一次尝试图像生成AI,最推荐ChatGPT的图像生成功能。原因很简单——"能边聊天边做图"。

例如:

  1. "帮我画一幅巴黎咖啡馆的水彩画风插画" → 生成图像
  2. "色调再暖一些" → 修改后的图像出来了
  3. "在露天座位上加一只猫" → 进一步修改

这种通过对话逐步接近理想图像的过程,比专业工具直观得多。2025年3月ChatGPT图像生成功能大幅升级后(GPT-4o原生图像生成),品质已经达到专业创作者认可的水平。

追求品质选Midjourney

Midjourney在"艺术性"方面独树一帜。独特的风格和精美的画面是它的魅力,不少专业设计师和插画师也在使用。月费$10起,可通过Web应用操作。使用"风格参考"功能,还能参考已有图片的风格来批量生成统一风格的图像。

但不支持像ChatGPT那样"边聊天边修改"。提示词的写法需要一些技巧,基本以英文指令为主。

追求自由度选Stable Diffusion

Stable Diffusion是开源的图像生成模型,安装在自己的电脑上就能免费无限量生成图像。还能用LoRA技术训练自定义风格。不过,需要一定的GPU(显卡)配置和技术知识。

最近ComfyUI和Forge UI等图形界面工具越来越完善,比以前更易上手。适合"不想花钱又想大量生成图片"或"想精细定制"的用户。

使用图像生成AI的注意事项

图像生成AI的进步令人瞩目,但也有需要注意的地方:

  • 版权 ― 生成图像的版权因国家和服务而异。商业使用时请确认服务条款
  • 虚假图像风险 ― 生成与真实人物相似的图像存在伦理问题。各服务都设有限制
  • 训练数据问题 ― 用现有艺术家的作品进行训练一直受到批评

这些问题将在第5章"AI的风险与伦理"中详细讨论。

编程AI的世界

觉得"编程跟我没关系"的朋友,请稍等。编程AI的发展不仅与程序员相关,而是关乎所有职场人士

因为有了编程AI,"没有编程经验也能做App"的时代已经来临。McKinsey调查(2024年)显示,引入编程AI的开发团队生产力最高提升了55%

GitHub Copilot ― 编辑器中的搭档

GitHub和Microsoft提供的编程AI,也是使用最广泛的。在VS Code等代码编辑器中运行,在你写代码的过程中提示"接下来应该写的代码"。

例如,只要写了函数名,就能自动建议整个函数体;只写注释,就能生成对应的代码。价格为免费版(有限制)、个人版$10/月、企业版$19/月(截至2026年3月)。

Cursor ― AI优先的编辑器

Cursor是一款从零开始为"与AI协作"设计的代码编辑器。基于VS Code,但AI交互是编辑器的核心。只需用自然语言说"找出这个文件的Bug"或"添加这个功能",就能一次性对多个文件进行代码修改。

价格为免费版(有限制)、Pro $20/月、Business $40/月。在程序员中快速普及,在2025年Stack Overflow Developer Survey中也作为热门工具被提及。

Codex ― 云端自主编程代理

OpenAI在2025年5月发布的云端编程代理。给出任务指令后,它会在云端沙盒环境中自主编写代码、运行测试,完成后提交Pull Request(代码变更提案)。截至2026年3月,周活跃用户已超过200万人(OpenAI公布)。

包含在ChatGPT Plus($20/月)中,无需额外付费。特别适合"希望在后台推进工作"、"想把常规代码编写任务交出去"的场景。CLI工具也已开源。

Claude Code ― 在终端运行的AI工程师

Anthropic提供的开发者CLI工具。可以直接从终端向Claude提出编程需求,它能自主完成文件读写、Git操作、测试执行等。在SWE-bench(编程能力基准测试)中以80.9%的得分位列顶级。

与Codex在云端异步工作不同,Claude Code在本地环境中实时交互式工作。实际上,本站(AI Arte)就是用Claude Code开发的。Claude Pro($20/月)即可使用。

不会编程也能用AI

编程AI虽然是面向专业人士的工具,但聊天AI(ChatGPT、Claude、Gemini)也有强大的编程辅助功能。即使没有编程知识,也可以这样使用:

  • 制作Excel宏 ― 说"帮我写一个按部门汇总月销售额的宏",就能得到直接复制粘贴使用的代码
  • 制作网页 ― 说"帮我做一个简单的个人介绍页面的HTML和CSS",就能得到可以直接发布的页面
  • 数据整理 ― 说"帮我写一个从这个CSV中只提取北京数据的Python脚本"
  • 自动化脚本 ― 如"每天定时备份文件夹内文件的脚本"这样的日常任务自动化

也就是说,编程AI不仅仅是程序员的工具,而是对所有"想通过简单自动化让工作更轻松"的人都有价值。学会第3章的提示词技巧后,还能更有效地使用它。

想深入学习编程的朋友,也可以看看第6章关于AI代理的内容。编程AI是当前进化最快的领域。

按需选择 ― 用流程图找到适合的工具

读到这里觉得"信息量太大了"的朋友,我们准备了一个简单的流程图。来找找适合自己的工具吧。

按需推荐AI工具流程图

推荐的入门方式

说实话,第一步最稳妥的选择是先试试ChatGPT。它是全能型的,聊天、图像生成、搜索、编程辅助,一个服务几乎覆盖所有用途。

然后如果觉得"想要更好的文字质量"就试Claude,"想要Google联动"就试Gemini,"想要带出处的调研"就试Perplexity ― 这样逐步扩展自己的工具库,是最无压力的方式。

别忘了AI搜索引擎

最后说一个容易被忽视的类别。以Perplexity为代表的AI搜索引擎,是能彻底改变信息检索效率的工具。

传统的Google搜索需要你一个一个打开搜索结果,自己汇总信息。AI搜索引擎能跨多个网站分析信息,生成附带出处的回答。只需问"告诉我关于XX的最新信息",它就能从学术论文到新闻报道全面调研后给出答案。

Perplexity免费版就很好用,建议试一试。你的调研体验会焕然一新。

总结 ― 比起完美选择,先动手更重要

本章介绍了4大类AI工具。回顾一下:

  • 聊天AI(ChatGPT / Claude / Gemini)― 全能型,先从这里开始
  • 图像生成AI(ChatGPT / Midjourney / Stable Diffusion)― 视觉内容制作
  • 编程AI(Copilot / Cursor / Codex / Claude Code)― 提升开发效率
  • AI搜索引擎(Perplexity / Gemini)― 大幅提升调研质量和速度

重要的是不要想着"找到最好的工具再开始"。每个工具都能在几分钟内上手,不合适就换一个。与其追求完美选择,不如先试用一个 ― 这才是活用AI的最短路径。

下一章将学习影响AI输出质量的关键因素 ―"提示词技巧"。无论选择什么工具,使用方法的不同都会让结果天差地别 ― 我们将深入探讨这个核心。

参考文献

  • Similarweb / First Page Sage「AI Chatbot Market Share 2026」(2026年1月)
  • Fortune Business Insights「Artificial Intelligence Market Size」(2026年,市场规模$5,145亿)
  • McKinsey Global Institute「The State of AI: How organizations are rewiring to capture value」(2024年)
  • Panto「AI Coding Assistant Statistics」(2025年,84%的开发者使用AI编程工具)
  • 各服务官网: ChatGPT / Claude / Gemini / Perplexity