国内AI大模型已近80个,哪个最有前途?

  • 商海奇谭
  • 2024-12-24
  • 105
  • 共4人发表观点
网友「IT桔子 」发表观点
2025-02-13

IT桔子目前收录的国内大模型/AIGC相关创业公司有134家。

大模型创业者的画像

在当前的新闻舆论领域,国内大模型创业者的背景呈现出明显的多样性,但主要可以归纳为两大类。

第一类是那些曾在互联网大厂担任中高层技术骨干的专业人士。

这些人通常拥有丰富的行业经验和深厚的技术积累,他们在大型互联网公司中负责过关键技术岗位,对人工智能、机器学习、大数据处理等领域有着深刻的理解和实践经验;同时具备了项目管理、团队管理以及商业运营的能力,这使得他们在创业时能够快速适应市场变化,推动技术创新和产品开发。

根据IT桔子数据观察,大模型赛道里大厂派系的创业者代表包括:

  • 百度系:灵犀深智创始人曹晓冬、风平智能创始人林洪祥、硒钼科技CEO向辉、大麦查OctaAI创始人王巍巍、rct AI创始人吕骋等;
  • 微软系:硅基流动创始人袁进辉、阶跃星辰创始人姜大昕、Sand AI/三呆科技CEO曹越、秘塔科技CEO闵可锐;
  • 字节跳动系:爱诗科技创始人兼CEO王长虎、慧杉科技创始人陈扬羽;
  • 阿里巴巴系:妙鸭相机产品PM/沐言智语创始人张月光、全灵Seele创始人王诗沐、RWKV元始智能联合创始人罗璇;
  • 滴滴系:“人生旷野”三位联创罗文(前滴滴造车副总裁)、封朋成(前滴滴安全部总监)、杨振麟。

第二类则是拥有顶尖高校科研工作背景的创业者。

这类创业者往往深耕学术界,有着深厚的理论基础和科研能力,他们或曾是高校的教授、主任、院长,专注于人工智能、计算机科学等前沿领域的研究。并且他们还擅长将最新的AI科研成果转化为应用,这些创业者通常对技术细节有着精准的把握,能够引领团队在技术研究和产品开发上取得突破。

AIGC/大模型赛道的学院派代表有:

  • 黄民烈,是清华大学计算机科学与技术系长聘教授,清华大学基础模型中心副主任,2021年创办了聆心智能,2023年公司被智谱AI收购;
  • 新畅元创始人/CEO邱见明,是深圳清华大学研究院虚拟数字人研发中心主任;
  • 塔普智能Tapall.ai联创/CSO郑锋,曾任南方科技大学副教授,主要研究多模态大模型。

这两类背景的创业者各有优势,但他们在国内大模型领域中扮演着重要的角色,而且一些头部大模型企业往往会组建具有互补型背景的创始团队,来充分发挥各自的优势,取长补短。


国内大模型独角兽企业及其当前状态

伴随着ChatGPT席卷全球,2023年后的大模型融资驶入了快车道,同时原搜狗CEO王小川、李开复这样的超级大佬也在去年下半年纷纷加入大模型创业浪潮中。

所以,几家头部企业基本都是2023下半年到2024年初这半年多的时间内密集融资,快速晋升独角兽。他们背后的投资方也是清一色的顶级头部机构,如红杉中国、经纬创投、深创投等,以及腾讯投资、阿里巴巴两大互联网巨头也各自下重注。

据IT桔子数据,截止2024年11月,目前国内的大模型/AIGC独角兽企业共有5家,分别是Minimax稀宇科技、智谱AI、百川智能、零一万物、月之暗面Moonshot AI。

IT桔子注意到,这5家独角兽在2024年均披露了新的融资,包括Minimax完成6亿美元战略融资,月之暗面今年完成3亿美元B轮融资,百川智能7月宣布了50亿元的A+轮融资,智谱AI在年内则有2笔新融资进账,可见大模型融资炙手可热。

这5家独角兽公司的核心创始团队,集中了连续成功创业者、顶尖高校毕业生、知名投资人、教授团队等因素。

MiniMax创始人闫俊杰:本科就读于东南大学数学专业,硕士毕业于重庆邮电大学信息与通信工程专业,博士毕业于中科院自动化所,并在清华大学计算机系完成博士后研究。曾在商汤科技担任副总裁、研究院副院长及智慧城市事业群CTO,负责深度学习工具链和底层算法的搭建以及通用智能技术的发展。

月之暗面创始人杨植麟:清华大学交叉信息学院、智源青年科学家,曾参与Google Gemini、Google Bard、盘古NLP、悟道等多个大模型的研发,并手握多项AI大语言模型领域核心技术论文。

百川智能创始人王小川:毕业于清华大学计算机科学与技术专业,曾任搜狗CEO。核心团队由来自搜狗、百度、华为、微软、字节、腾讯等知名科技公司的AI顶尖人才组成。

零一万物创始人李开复:曾任谷歌全球副总裁兼大中华区总裁,微软全球副总裁,以及创新工场董事长兼首席执行官;团队成员包含前阿里巴巴副总裁、前百度副总裁、前滴滴/百度首席算法负责人、前谷歌中国高管、前微软/SAP/Cisco副总裁等。

智谱AI CEO张鹏:毕业于清华大学计算机系,曾作为硕士研究生进入KEG实验室深造,此后攻读清华2018创新领军工程博士;董事长刘德兵、总裁王绍兰均为清华校友,分别出任智谱AI的董事长和总裁。

天时地利、超级知名创业者的下场参与,以及资本的助力等多种因素的加持下,成就了AIGC独角兽的快速诞生、而这样的火热已然持续了一年多。

不过,众所周知大模型研究对资金量需求及其庞大,虽然头部创企融资颇多,但后续发展依然需要持续的融资紧张。到2025年,他们是否还能够保持如此密集的融资节奏和高额的融资额度,还需观察。

在快节奏融资的当下,大模型独角兽的发展和成就如何呢?

据悉,智谱AI的GLM大模型在多轮多意图的语义理解能力以及文档精准有效的总结方面领先于国内外模型,并通过模型私有化、API调用完成GLM系列模型的商用落地。

Minimax稀宇科技布局了MoE架构,推出了文本大模型、语音大模型、图像大模型以及视频大模型,还与金山办公WPS合作打造了WPS AI产品,与掌阅科技合作打造“阅爱聊”。

月之暗面擅长长文本处理,Kimi智能助手支持200万字超长无损上下文,对科研友好。

零一万物计划分拆出独立AI应用公司“绿洲”,侧重to C产品,主推AI搜索应用。


大模型创业的挑战

人才和智力资源只是大模型创业起步的必要条件,要将事业做成,还需要多方面的要素。

AI大模型创业和发展面临的挑战和难点主要包括技术、硬件、商业化等几个方面。

技术挑战上,主要是可靠性问题,大模型有时会犯事实性错误,俗称“幻觉”,对于一些具体的数学问题,大模型逻辑推理能力与人类常识相悖;而且大模型训练需要大量的算力资源,算力成本压力大;高质量、标注好的大数据集构建获取难度又大等。

另外,如何将大模型技术转化为实际应用产品和服务,它需要解决性能、成本、稳定性等多个层面的问题,总之大模型的商业落地还有很长的道路要走。


本来节选自IT桔子报告《中国AI创业者人群画像报告(2024)》

网友「一朵小红花 」发表观点
2025-02-09

两年以后,这些大模型估计能够剩下的我就个位数了,这让我想起了之前一蜂窝搞机床,一蜂窝搞工业机器人,一蜂窝进去房地产,一蜂窝进入新能源,而最后剩下的往往只有几个。

为什么会有那么多,因为抄袭盗版美国的模型不花钱,没成本也就蜂拥而至了。

一旦不盈利,这些乱七八糟都想来分一杯羹的所谓ai大模型,都会迅速的死去。

网友「猪怕撞 」发表观点
2025-02-06

当前国内AI大模型竞争已进入深水区,从技术路线、商业落地、生态建设三个维度进行专业评估,以下为关键分析框架:

一、头部企业梯队(综合实力型)

  1. 百度文心大模型(ERNIE 4.0)
  • 技术优势:搜索数据+知识增强双轮驱动,中文语义理解准确率领先3-5个百分点
  • 商业化路径:已接入百度搜索广告系统(提升CTR 15%),智能云客户超8万家
  • 战略布局:生物计算大模型赋能新药研发(缩短周期40%)
  1. 阿里云通义千问2.5
  • 核心突破:多模态生成能力(图文跨模态对齐误差降低至7.3%)
  • 行业渗透:零售业智能客服(双11承接68%咨询量),制造业数字孪生
  • 生态壁垒:依托阿里云市场份额(国内34%)构建模型即服务(MaaS)
  1. 华为盘古大模型3.0
  • 差异化路径:专注B端垂直领域(矿山场景能耗降低18%,港口调度效率提升25%)
  • 硬件协同:昇腾910B芯片+ModelArts平台形成全栈优势
  • 政企突破:已落地30+智慧城市项目,政务大脑市占率第一

二、新锐势力(技术突破型)

  1. 智谱AI(GLM-130B)
  • 学术基因:全球首个中英双语千亿模型,在CLUE榜单持续霸榜
  • 商业化验证:金融风控模型已服务招商银行等12家头部机构
  1. 月之暗面(Kimi)
  • 长文本突破:支持20万字上下文处理(超越GPT-4的128k tokens)
  • 场景创新:法律文书分析效率提升400%,教育领域市占率快速攀升
  1. 深度求索(DeepSeek-R1)
  • 数学推理:在国际数学奥林匹克竞赛(IMO)测试中得分率91%
  • 行业纵深:聚焦量化交易模型研发,私募合作机构超20家

三、潜力赛道(细分领域型)

  • 医疗健康:数坤科技的「数字医生」已获三类医疗器械认证
  • 内容创作:昆仑万维「天工3.0」在网文生成市场占据63%份额
  • 工业制造:创新奇智「奇智孔明」在汽车质检场景准确率达99.97%

四、战略选择关键指标

  1. 算力储备(万卡规模):百度(4.2万)>阿里(3.8万)>华为(3.5万)
  2. 数据壁垒:微信生态(腾讯)、电商数据(阿里)、工业数据(华为)
  3. 落地速度:政务领域(华为3个月交付)、金融领域(智谱AI 45天部署)
  4. 资本热度:月之暗面单轮融资超10亿美元,Minimax估值超25亿美元

五、风险预警

  • 中美算力差距:英伟达H100芯片储备量仅为美国头部企业的1/15
  • 行业洗牌预期:2024年底或将出现50%以上模型团队转型或退出
  • 监管合规成本:大模型备案平均耗时87天,内容过滤投入占比营收12%

建议关注:百度文心(全栈生态)、华为盘古(产业纵深)、月之暗面(长文本突破)构成的「铁三角」格局,同时密切跟踪上海人工智能实验室、北京智源研究院等「国家队」在通用人工智能(AGI)领域的突破性进展。企业选型应重点考察行业知识蒸馏能力、私有化部署成本(通常需300-500万元/年)、持续迭代承诺(版本更新周期<6个月)等实操维度。

网友「虎杖论天下 」发表观点
2025-02-05

最近大家认为deepseek最有前途,甚至认为它可以颠覆美国AI的领先地位,而且还不需要增加算力!

这会不会是企业营销的手段呢?美国人指责deepseek蒸馏了美国AI系统,已经启动了对该软件的调查,后续结果难料,不排除出现华为公司的后果——美国出台法案制裁这家企业。

回顾清廷退位后,走向共和,开启主权在民理论的落实;但各种势力各展其能,开始了疯狂抄底行动,而人民的主权却无人当回事;本来可以由主人投票产生的公仆,最后异化了,让中国无法成为发达国家,至今不如日本、韩国、新加坡的经济发展水平。历史说明,中国的AI之路也不会顺利,本来单纯的科技项目,现在似乎将弄成

中国国际斗争的导火索。

用历史经验判断,先抄底的人工智能大模型未必成为主流 ,甚至可能是过眼云烟。让市场选择,是唯一正确的方法;企图调动民族感情或者公权力为自己贴金赚钱,其走向深渊是大概率事件,中华民族伟大复兴不需要被裹挟、被忽悠、被利用。

网友评论(0)

暂无网友评论