豆包,是北京春田知韵科技有限公司基于云雀模型开发的AI智能助手,提供聊天机器人、写作助手以及英语学习助手等功能,可以回答各种问题并进行对话,帮助人们获取信息。豆包有网页版、iOS版、安卓版、Windows桌面版、Mac OS桌面版,支持手机号码、抖音、以及苹果公司账号登录。

2016年,字节跳动就成立了人工智能实验室AI Lab。2023年6月左右,字节跳动在内部测试一款AI对话类产品——Grace。2023年8月,Grace新版本更名为“豆包”,并开始启动测试。2024年6月3日,豆包推出桌面客户端,支持Windows/macOS,快捷启动、AI划词、AI搜索。同年8月8日,豆包上线音乐生成功能。同年8月16日起,豆包推出脑图功能。同年8月30日,豆包输入框新增语音输入和图片上传入口。同年9月6日,豆包输入框新增“停止生成”按钮。同年10月10日,豆包发布了首款AI智能体耳机Ola Friend,该款耳机接入豆包大模型,并与豆包APP深度结合。同年10月28日,语音通话功能上线,支持回复实时信息。同年11月,豆包正式推出视频生成内测。

2025年1月20日,豆包发布了最新的“端到端”语音大模型,并基于该模型更新豆包APP的实时语音通话功能。2025年2月,豆包优化了首页的布局和交互逻辑,为用户提供更加简洁流畅的使用体验。同年3月4日,豆包大模型团队宣布开源SuperGPQA。同年3月,抖音App测试接入豆包App的AI能力,并且在抖音App内为豆包App开放了两个超级入口。同年3月,豆包测试新版“深度思考”功能。同年4月,豆包深度思考和文生图3.0模型已通过火山引擎正式开放API,供开发者和企业客户使用。同年5月23日,豆包宣布在App端上线实时视频通话功能。同年6月,豆包电脑版全量上线AI播客功能。同年6月30日,豆包“深入研究”功能在豆包App、网页端、电脑版正式开启测试,用户可免费体验。同年7月30日,火山引擎宣布,豆包·图像编辑模型SeedEdit 3.0正式登陆火山方舟。

截至2024年11月底,豆包APP的累计用户规模超过1.6亿。截至2025年3月底,豆包大模型日均调用量已达到12.7万亿次。2025年4月,豆包在华尔街见闻2024Smart Future·AI应用标杆评选活动中获评卓越人工智能产品奖。

发展历程

2016年,字节跳动就成立了人工智能实验室AI Lab,聚焦于自然语言处理、机器学习、数据挖掘等方面的研究。2023年6月左右,字节跳动在内部测试一款AI对话类产品,暂时称作“Grace”,该产品处于测试完善的阶段。

2023年8月,字节跳动旗下AI对话产品Grace新版本已更名为“豆包”,并开始启动测试,版本支持手机号码、抖音、以及苹果公司账号登录,用户可以通过与豆包进行对话,生成歌词、小说、文案等文本内容。每段回答除了文字外,也会由数字人豆包进行语音回答。

2024年5月,2024春季火山引擎Force原动力大会上,字节跳动产品和战略副总裁朱骏表示,豆包App总下载量已达1亿次。豆包大模型将开启商业化,价格相比同行便宜99.3%,定价0.0008元/千Tokens。大模型的“token”是指在自然语言处理任务中,模型所使用的输入数据的最小单元。这些token可以是单词、子词或字符等。同年6月3日,豆包推出桌面客户端,支持Windows/Mac OS,快捷启动、AI划词、AI搜索。同年8月8日,豆包上线音乐生成功能,用户在豆包“音乐生成”中输入主题或歌词,设定音乐风格、情绪及音色,便能快速生成一首约1分钟的词曲,豆包生成的音乐时长不超过1分钟,歌词字数不超过200字,支持一键分享至抖音等社交平台。同年8月16日起,豆包推出脑图功能,在上传文件时,可选择“生成脑图”功能,可快速梳理文档,一键理清思考框架。同年8月30日,豆包输入框新增语音输入和图片上传入口。同年9月,2024火山引擎AI创新巡展上,火山引擎总裁谭待宣布推出豆包·视频生成模型。两款新发布的大模型分别是,豆包视频生成-PixelDance和豆包视频生成-Seaweed,这两款大模型的发布,意味着字节跳动首次正式宣告进军AI视频生成。同年9月6日,豆包输入框新增“停止生成”按钮。

2024年10月10日,字节跳动豆包发布了首款AI智能体耳机Ola Friend,该款耳机接入豆包大模型,并与豆包APP深度结合。用户戴上耳机后,无需打开手机,便能通过语音唤起豆包进行对话。同年10月28日,语音通话功能上线,支持回复实时信息。同年11月,豆包正式推出视频生成内测,支持图片文字一键成片、动态运镜和多镜头一致性、风格比例随意挑选。

2025年1月,豆包大语音模型成为首家“引领级”通过中国信通院语音大模型能力评估的产品。同年2月,豆包优化了首页的布局和交互逻辑,为用户提供更加简洁流畅的使用体验。同年3月4日,豆包大模型团队宣布开源SuperGPQA,一个领域全面且具备高区分度的知识推理基准测试。该数据集构建了覆盖285个研究生级学科、包含26529道专业问题的评估体系,不仅涵盖主流学科,更将轻工业、农业、服务科学等长尾学科纳入其中,展现出全面学科的覆盖广度,填补了长尾知识评估领域的空白。同年3月,抖音App测试接入豆包App的AI能力,并且在抖音App内为豆包App开放了两个超级入口,一个位于短视频界面,与点赞、评论、转发等功能处于同一竖列;另外一个入口则位于抖音App的消息列表内。对此,抖音相关负责人表示,相关能力测试中,主要是希望为用户提供更丰富的AI服务。同年3月12日,豆包大模型团队正式发布文生图技术报告,首次公开Seedream 2.0图像生成模型技术细节,覆盖数据构建、预训练框架、 后训练RLHF全流程。同年3月,豆包测试新版“深度思考”功能,该功能将推理过程的思维链与搜索深度结合,支持“边想边搜”。

2025年4月,豆包深度思考和文生图3.0模型已通过火山引擎正式开放API,供开发者和企业客户使用。同年4月,字节跳动推出文本生成图像模型Seedream 3.0,文生图跑分超GPT-4o,字节跳动计划未来将Seedream3.0集成至“豆包”。同年4月,字节AI产品部门Flow旗下发生产品调整:社交陪伴类AI产品猫箱原负责人梁琛奇已离开字节跳动;猫箱负责人由原星绘产品负责人西原(花名)接任;同时,星绘团队计划并入豆包,将由豆包App端负责人陆游(花名)一起管理。

2025年5月23日,豆包宣布在App端上线实时视频通话功能,用户在“打电话”界面点击视频按钮即可开启视频通话,豆包可获取用户摄像头拍摄的实时画面,支持基于真实场景与用户进行实时问答互动。该功能基于最新的豆包视觉理解模型,该模型具备多模态信息融合处理、复杂任务处理及实时联网检索三大能力,拥有较好的内容识别、理解推理和内容描述能力,能够融合视觉与语言输入进行综合深度思考和创作,可完成解微积分题、分析论文图表、诊断真实代码问题等复杂逻辑计算任务。其应用场景具体丰富,如在文化旅游中,可为用户讲解故宫太和殿的历史沿革、古埃及罗塞塔石碑的文化意义;教育学习时,能解析数学错题的解题思路、辅助理解物理实验图表;办公场景下,可智能处理合同文档的关键信息提取;生活里,能识别水果成熟度、推荐契合用户兴趣的书籍等。通过优化架构,豆包的平均响应延迟控制在800毫秒以内,交互流畅度接近自然对话;技术团队还实现了“情境保持”能力,可在连续视频流中持续跟踪对话主题(例如用户突然提问“刚才看到的蔡磊的书在哪里”,豆包仍能准确回溯并解答)。为提升对话准确性与时效性,该功能还接入了联网搜索能力,支持实时获取互联网最新信息。同年6月,豆包电脑版全量上线AI播客功能,用户上传PDF或网页链接后,可一键生成双人对话的播客节目,有参与内测的用户表示,会将一些较长的学习资料发给豆包,一键转成语音,AI播客生成的对话在音色上十分接近真人,甚至停顿、语气词等细节都与日常讲话无异。同年6月30日,豆包“深入研究”功能在豆包App、网页端、电脑版正式开启测试,用户可免费体验。同年7月30日,火山引擎宣布,豆包·图像编辑模型SeedEdit 3.0正式登陆火山方舟。

功能和服务

豆包提供聊天机器人、写作助手以及英语学习助手等功能,它可以回答各种问题并进行对话,帮助人们获取信息。同时还具备AI云盘、生成视频、拍题答疑、制作PPT、健康咨询、看网站以及数据分析等功能。

智能对话

豆包AI能够理解和解析自然语言,用户可以通过语音或者文字的方式输入问题,它会像人一样用自然流畅、逻辑清晰的文本进行交流回复。豆包AI储备了众多领域的知识,可以为用户提供准确有用的信息。

AI生图

用户提供生成图像内容的关键词或对图像场景进行描述,可以对图像的风格进行指定,如水墨画、卡通图等,还可以指定图像中各元素的具体要求,如颜色、形状、构图等。豆包AI会根据用户提供的信息进行创作并生成相关图像。

智能写作

豆包AI可以根据关键词帮用户写各类文案,可以按用户指定的写作类型和需求撰写不同风格的文章,用户还可以提出写作要求如风格、文章长度及语言等。它还可以润色完善已有文本,提炼总结文字内容,满足用户在写作方面的多种要求。

音乐生成

豆包AI的音乐生成功能,可以帮助用户生成音乐,用户通过描述想要的音乐风格、情绪氛围以及主题思想,它就可以轻松创作出旋律和歌词。

录音纪要

豆包AI的录音纪要功能能够将录音中的语音转换成文字形式方便用户查看和编辑。它能够自动分析录音内容,提取出比如会议的主题、讨论的要点、时间节点等关键信息,以清晰的结构呈现给用户。

PPT大纲生成

当用户输入一个主题或内容要求后,豆包AI就能生成一个条理清晰、逻辑连贯、结构合理的PPT大纲,为用户PPT的设计提供了思路。

文档阅读

用户可以将Word文档、PDF文件或是其他格式的文件上传给豆包AI,它可以对文档进行阅读并快速分析文档。比如上传一篇论文,豆包可以快速提取出论文的研究背景、目的、方法、结论,帮助用户了解论文的核心内容。

网页阅读

用户只需将网页的链接交给豆包AI,它可以对这个网页的内容进行分析提取关键信息,如网页中的重要文本、数据、图表等,并进行总结分析。

深入研究

选择“深入研究”,输入详细指令或一句话prompt,等待几分钟,即可生成一份报告。使用豆包App生成报告后,还可以打开报告内容,选择右上角“听”按钮,一键转成播客,随时听。

生成脑图

在上传文件时,用户可以选择“生成脑图”功能,快速梳理文档,一键理清思考框架。

数据分析

数据分析可一键实现数据合并去重、格式转换、数据分析以及图表绘制等操作,让数据工作变得更简单。

语音通话

在电脑上可通过语音通话功能与豆包语音对话,点击首页输入框右侧入口即可开启。通话过程中,豆包还能实时联网搜索最新信息,确保提供更精准的回答,同时还支持方言与英语对话、多角色模仿等,交互效果接近真人。此外,语音通话中还含有“灵魂歌手”模式,可让豆包演唱如Taylor Swift的《Love Story》等作品,也能按用户指令生成含特定歌词的歌曲,其曾在火山引擎发布会上现场演唱《月亮代表我的心》,能把控节奏、儿化音等细节。

AI播客

用户可以用PDF文档或网页链接,一键生成内容丰富、语音自然的播客节目,随时随地用耳朵获取信息。

AI编程

豆包的电脑版和网页版AI编程功能支持多文件上传、GitHub仓库引入、新代码编辑器等,并提供编程自学辅助。同时拥有可视化编辑功能(即“应用创造1.0”),可让通过“AI编程”生成的网页应用在预览界面直接进行文字编辑、智能换图,还能精准选中局部元素进行调整,类似修改PPT内容。

合作交流

2025年2月,路特斯汽车中国官方宣布,豆包AI助手将上车,宣称“原生能力深度融合”。

研发团队

豆包备案信息为北京春田知韵科技有限公司。天眼查显示,该公司注册资本100万元,法定代表人为严林,成立时间2023年7月26日,由北京抖音信息服务有限公司全资持股。经营范围含计算机系统服务、数据处理服务、软件开发、数字内容制作服务(不含出版发行)、网络文化经营等。

字节机器人团队隶属于字节 AI Lab,其负责人是 AI Lab 总监李航。李航曾担任华为诺亚方舟实验室主任和首席科学家,2017年加入字节,向字节副总裁、算法技术负责人杨震原汇报。

应用平台

截至2025年7月,豆包有网页版、iOS版、安卓版、Windows桌面版、Mac OS桌面版,其中iOS版需要使用TestFlight安装。豆包支持手机号码、抖音、以及苹果账号登录。

品牌荣誉

社会影响

2024年11月的AI大模型月活跃排行榜上,豆包App以5998万MAU的成绩,稳居全球第二,仅次于OpenAI的ChatGPT,在中国国内排名第一。而它的海外版Cici的MAU也有1267万,排在第22位。

2024年12月19日,智源研究院发布最新一期大模型综合及专项评测结果。在覆盖国内外100余个开源和商业闭源大模型的评测中,豆包通用模型pro获得大语言模型主观评测最高分;在多模态模型评测中,豆包视觉理解模型排名视觉语言模型第二,成绩仅次于GPT-4o;豆包文生图模型、豆包视频生成模型(即梦P2.0 pro)也分别在相应测试中获得全球第二。

截至2024年11月底,豆包APP的累计用户规模超过1.6亿。截至2025年3月底,豆包大模型日均调用量已达到12.7万亿次。

社会评价

纵观市面上再能整活的AI,大部分顶多还是在言语上够犀利。但豆包厉就厉害在,与它对话几乎毫无违和感,甚至就是有种跟真人聊天的既视感。可以说,豆包的出现,让AI不再是年轻白领的专属工具,而是变成老少通杀的电子玩具。(新浪财经 评)

参考资料

字节跳动抖音子公司推出 AI 机器人“豆包”,基于云雀模型.IT之家.2023-10-23

字节跳动推出AI对话机器人“豆包” 记者实测体验!.财联社.2025-07-30

字节豆包推出桌面客户端:支持 Windows / macOS,快捷启动、AI 划词、 AI 搜索.IT之家.2025-07-30

豆包.豆包.2025-07-30

字节旗下火山引擎发布AI助手:背靠自研大模型,原生应用仍需时日.今日头条.2023-10-23

字节正在内部测试对话类AI项目.环球科技.2025-07-30

字节跳动AI对话产品“豆包”上线 回应:仍是小范围邀请制测试,存在较多局限.百家号.2025-07-30

字节跳动旗下AI助手豆包上线音乐生成功能.百家号.2025-07-30

产品动态.豆包.2025-07-30

字节豆包推出AI智能体耳机Ola Friend 售价1199元.中国新闻网.2024-10-10

字节跳动 AI 助手豆包被曝开启视频生成内测.IT之家.2025-07-30

豆包App灰度最新语音模式,实现了GPT-4o不会的唱歌.新浪财经.2025-08-11

285 学科全覆盖!豆包大模型团队开源基准测试集 SuperGPQA.字节跳动.2025-07-30

抖音回应接入豆包:相关能力测试中.财联社.2025-07-30

豆包测试新版深度思考功能 支持边想边搜.百家号.2025-07-30

豆包深度思考和文生图3.0模型开放API.百家号.2025-07-30

豆包上线视频通话功能:支持实时问答互动,具备视觉理解能力.IT之家.2025-07-30

豆包电脑版上线AI播客功能.百家号.2025-07-30

豆包上线“深入研究”:长途旅行攻略、政策解读、科技趋势分析都能处理.IT之家.2025-07-30

豆包图像编辑模型3.0上线火山方舟.百家号.2025-07-30

字节氪金10亿的“掌上明珠”,快被全网玩坏了.百家号.2025-07-30

字节发布深度思考模型 具备“看图思考”能力.新华网.2025-07-30

2024「Smart Future·AI应用标杆」| 评选结果公布.微信公众号.2025-07-30

字节跳动:豆包大模型将开启付费,定价0.0008元/千Tokens.新浪科技.2024-05-15

字节跳动正式宣告进军AI视频生成,豆包视频生成大模型正式发布.百家号.2025-07-30

豆包语音大模型首家引领级通过中国信通院语音大模型评估.澎湃新闻.2025-07-30

豆包文生图技术报告发布.科创板日报.2025-07-30

字节 Seedream 3.0 登场:文生图跑分超 GPT-4o.百家号.2025-07-30

字节AI产品据悉调整:猫箱负责人离职,星绘并入豆包.数智化发展研究中心.2025-07-30

字节跳动豆包上线视频通话功能:AI视觉交互开启“场景伙伴”新时代.今日头条.2025-08-03

豆包上线视频通话功能,支持实时视频问答.今日头条.2025-08-03

豆包上线视频通话功能,支持实时视频问答.今日头条.2025-08-03

字节跳动豆包上线视频通话功能:AI视觉交互开启“场景伙伴”新时代.今日头条.2025-08-05

让桌面上的每一个应用都接入 AI.豆包.2025-08-08

智能助手豆包AI功能介绍基础部 张静.西北大学现代学院.2025-07-30

豆包上线“深入研究”功能.百家号.2025-07-30

字节系大模型上新,AI智能体规模化应用加速.今日头条.2025-08-07

豆包App更新实时语音通话功能,中文对话断崖式领先,人机难辨!.今日头条.2025-08-07

豆包AI编程新增可视化编辑功能:支持在预览界面直接编辑文字、智能换图.新浪财经.2025-08-07

豆包 AI 助手将上线莲花跑车,宣称“原生能力深度融合”.百家号.2025-07-30

字节上线AI对话产品“豆包”.今日头条.2023-10-23

字节跳动AI对话产品“豆包”上线 回应:仍是小范围邀请制测试,存在较多局限.今日头条.2023-10-23

字节跳动抖音子公司推出AI机器人“豆包”,现已开始对外测试.今日头条.2023-10-23

你光看见豆包火了,却没见豆包背后的大模型有多卷.钛媒体.2025-07-30

智源评测出炉:豆包大语言模型排名第一,多模态能力获得三项第二.今日头条.2025-07-30