中文AI模型集合-本文已经过时-Piper's Blog

最近中文模型开启了内卷，价格已经到了很低的水平，给大家整起。

快速入口在我的主页上都是有的 https://pipers.cn

密码是我的微信名。

文心一言-百度

文心一言（英文名：ERNIE Bot）是百度公司开发的一款人工智能语言模型。它基于文心大模型技术推出，是百度在人工智能领域深耕十余年后，拥有产业级知识增强文心大模型ERNIE的基础上，利用跨模态、跨语言的深度语义理解与生成能力而开发的一款AI聊天机器人 ¹。
文心一言具备多项功能，包括：
文学创作：可以帮助你写文案、想点子，提供创意和灵感。
商业文案创作：支持撰写邮件、广告文案等商业用途的文案。
数理逻辑推算：具备数学、逻辑推理能力，可以处理数据、编写代码等。
中文理解：能够理解中文输入，回答问题，进行对话互动。
多模态生成：支持多种模态的内容生成，如文字、图片等 ²。
文心一言的应用领域广泛，包括搜索问答、内容创作生成、智能办公等。作为一个智能伙伴，它能够高效便捷地帮助人们获取信息、知识和灵感 ³ 。如果你有其他问题或需要更详细的介绍，欢迎继续提问！¹

阿里通义千问

通义千问（英语：Tongyi Qianwen）是由阿里巴巴集团旗下的云端运算服务科技公司阿里云开发的聊天机器人。它能够与人互动、回答问题以及协作创作 ¹ 。通义千问主要定向邀请企业用户进行体验测试，仅允许获得邀请码的企业用户在官网加入体验，需要登录阿里云账号 ²。
通义千问意在“通情，达义”，具备全副AI能力，致力于成为人们的工作、学习、生活助手。它的功能包括多轮对话、文案创作、逻辑推理、多模态理解、多语言支持，能够与人类进行多轮的交互，也融入了多模态的知识理解，且具备文案创作能力，例如续写小说、编写邮件等 ³。
通义千问的发展历程包括：
2023年4月7日，通义千问开始邀请测试。
2023年9月13日，通义千问大模型正式向公众开放，其APP在各大手机应用市场上线，所有人都可通过APP直接体验最新模型能力。
2024年5月9日，阿里云开源通义千问320亿参数模型Qwen1.5-32B，平衡性能、效率和内存占用 ⁴。
最新消息：2024年6月7日，阿里通义千问Qwen2大模型发布，涵盖多个尺寸的预训练和指令微调模型，上下文长度支持进一步扩展，最高达128K tokens ⁵。
通义千问作为阿里云的大模型，为企业和用户提供了强大的自然语言处理能力，助力数字化转型和智能化应用 ¹ 。²

deepseek

根据deepseek Github官方的描述

DeepSeek 是由量化巨头幻方开发的一款大模型，旨在探索通用人工智能（AGI）。让我为你详细介绍一下：
公司背景：
公司名称：杭州深度求索人工智能基础技术研究有限公司 ¹。
成立日期：2023年7月17日。
实控人：梁文锋 ²。
DeepSeek Coder：
第一代大模型，已开放内测。
功能：
快速编写Python程序。
修改用户界面（UI）。
测试程序中的错误（bug）。
数据分析。
学习SQL数据库语言。
性能：
在代码生成任务上超越了开源大模型CodeLlama，分别领先9.3%、10.8%和5.9%²。
70亿参数版本的DeepSeek Coder在代码能力上达到了CodeLlama的340亿参数水平。
经过指令调优后，DeepSeek Coder模型全面超越了GPT3.5-Turbo ²。
探索AGI：
幻方量化成立新的独立研究组织“深度求索”，致力于服务全人类共同利益，探索AGI的本质 ²。
DeepSeek作为一匹可能改变国内AI市场格局的“黑马”，其开源模型展示了在人工智能技术领域的实力和贡献 ³ 。⁴

阶跃星辰

阶跃星辰（英文名：LeapStar）是由微软前全球副总裁姜大昕创办的国内基础大模型创业公司 ¹。虽然成立于2023年，但直到最近才正式发布产品，这家公司一直保持低调。
创始人和背景
姜大昕：曾在微软工作16年，担任微软全球副总裁和微软亚洲互联网工程院首席科学家，负责必应搜索的技术研发工作 ¹。
产品
阶跃星辰已经推出了两款面向C端市场的应用，分别是：
跃问：效率工具，定位个人效率助手。它能够回答问题、处理文件、进行联网检索，甚至解读表情包 ¹。
冒泡鸭：AI开放世界平台，提供由多模态大模型驱动的智能对话体。用户可以进行有趣的对话，探索剧情互动游戏，甚至自己创建内容 ¹。
大模型成就
阶跃星辰已经成功研发了两款千亿参数大模型：
Step-1：千亿参数语言大模型，综合性能超过GPT-3.5 ¹。
Step-1V：千亿参数多模态大模型，能够精准描述和理解图像中的文字、数据、图表等信息，并实现内容创作、逻辑推理、数据分析等多项任务 ¹。
最近，阶跃星辰还发布了万亿参数MoE语言大模型Step-2的预览版，成为国内初创公司首次交出的万亿参数模型答卷 ¹。
阶跃星辰的目标是走向通用人工智能（AGI），并为多模态、长文本理解提供更好的解决方案。¹ ²

零一万物

零一万物（英文名：LeapStar）是由创新工场和前百度副总裁马杰共同创建的AI大模型研发商¹ 。总部位于北京，该公司集中在大模型技术、人工智能算法、自然语言处理、系统架构、算力架构、数据安全和产品研发等领域 ²。
零一万物致力于自研大模型，自建平台，构建数千卡GPU集群进行训练、调优和推理，以提高数据有效参数量，构建连续、可控、科学化的训练能力 ¹ 。该公司已经实现了百亿参数规模的模型内测，并计划推出开源的模型版本 ¹。
李开复博士亲自带队，塔尖孵化的AI2.0公司，零一万物正是这家创业公司的正式名称 ³ 。⁴
零一万物的目标是走向通用人工智能（AGI），为多模态、长文本理解提供更好的解决方案，以实现“零一智能，万物赋能”的雄心 ³ 。¹

直达连接

百川大模型

百川大模型是由百川智能推出的大模型产品。该公司成立于2023年4月10日，由搜狗公司创始人王小川和前搜狗COO茹立云联合创立，旨在打造中国版的OpenAI基础大模型及颠覆性上层应用 ¹。
百川大模型融合了意图理解、信息检索以及强化学习技术，结合有监督微调与人类意图对齐，在知识问答、文本创作领域表现突出 ² 。该公司已发布多款大模型，包括Baichuan-7B、Baichuan-13B、Baichuan-53B等，其中Baichuan 3更是超千亿参数的大语言模型 ³。
百川智能的使命是帮助大众轻松、普惠地获取世界知识和专业服务，构建中国最优秀的大模型底座。

直达连接

腾讯大模型 2024-07-01 已过期

~~腾讯混元大模型是由腾讯研发的通用大语言模型，拥有超万亿参数规模，具有强大的中文理解与创作能力、逻辑推理能力，以及可靠的任务执行能力~~¹ 。这一大模型支持广泛的功能，包括图片生成、文案创作、文字辨识，以及客户服务等，将在金融、公共服务、社交媒体、电子商务、交通运输、游戏等产业发挥重要作用 ² ~~。腾讯今年6月推出的模型即服务（MaaS）让企业可以训练自己独有的大模型，而混元让企业有能力打造出功能强大的工具~~² ~~。此外，腾讯云联合22家客户启动了行业大模型共建合作，为传媒、文旅、政务、金融等10余个行业提供超过50个大模型行业解决方案~~³ 。⁴

moonshoot

Moonshot AI 是一家神秘而备受关注的大模型创业公司。其创始人是清华大学交叉信息学院的杨植麟教授，他曾在FAIR和Google Brain工作，并是Transformer-X和XLNet论文的第一作者 ¹。这两篇论文在深度学习领域产生了深远影响。不过，杨植麟的人生并非一帆风顺。从小学到博士阶段，他都克服了许多挑战，成为了一位杰出的学者和创业者。
Moonshot AI 致力于研发下一代跨模态大模型。他们的首个产品是名为 Kimi Chat 的智能助手，支持输入20万汉字的上下文，具备强大的多语言能力 ² 。相比以英文为基础训练的大模型，Kimi Chat在中文上表现出色，实际使用效果超过了其他同类产品 ²。
此外，Moonshot AI 还发明了一些重要的技术组件，如RoPE相对位置编码和group normalization，为大模型的研发和应用做出了贡献 ³ 。他们的目标是让AI等待时间成为过去，让先进的算法服务于更广泛的用户群体，包括肤癌研究、疫苗开发、股市预测等领域 ⁴ 。⁵
总之，Moonshot AI 在大模型领域的创新和突破令人瞩目，值得密切关注。

直达连接

星火大模型

星火大模型（英文名：LeapStar）是由科大讯飞推出的新一代认知智能大模型 ¹ 。这一大模型拥有跨领域的知识和语言理解能力，能够基于自然对话方式理解与执行任务，提供语言理解、知识问答、逻辑推理、数学题解答、代码理解与编写等多种能力 ¹。
创始人和背景：
星火大模型由科大讯飞自研，董事长刘庆峰介绍称，该产品为基础大模型，后续还将推出升级版本 ²。
预计到10月24日，星火大模型的英文能力将达到ChatGPT水平，中文能力将超越ChatGPT ²。
应用领域：
星火大模型在金融、保险、智能助手等领域具备广泛的应用潜力 ³。
中国人保已基于星火大模型发布保险大模型，为企业提供定制化的智能服务 ³。
星火大模型的目标是走向通用人工智能（AGI），为多模态、长文本理解提供更好的解决方案，助力各行各业的数字化转型和智能化应用 ¹ 。² ³

质谱清言

智谱清言 是由北京智谱华章科技有限公司推出的生成式AI助手，于2023年8月31日上线 ¹ 。这一中文对话模型基于智谱AI自主研发的中英双语对话模型ChatGLM2，经过万亿字符的文本与代码预训练，并采用有监督微调技术，以通用对话的形式为用户提供智能化服务 ¹。
主要功能包括：
通用问答：回答用户各类问题，涵盖众多领域，提供实时、准确的信息和解决方案。
多轮对话：具备出色的对话能力，可以与用户进行自然、流畅的多轮对话，提供高效的沟通体验。
虚拟对话：根据用户需求扮演不同角色，增强互动性和用户体验。
创意写作：为用户的创作需求提供脑暴灵感、内容框架以及高质量的文案，提升写作效率和质量。
代码生成：使用多种编程语言进行开发和调试，解释代码、解答编程问题，或提供编程建议 ²。
智谱清言的上线标志着在工作、学习和日常生活中，用户可以便捷地获取智能化的帮助和解答。¹

MinMax

MiniMax 是一家成立于2021年12月的大模型初创公司，专注于开发AI解决方案。让我为你详细介绍一下：
创始人和背景：
MiniMax由前商汤科技副总裁、商汤科技研究院副院长、通用智能技术负责人闫俊杰创立。
另一名核心成员是闫俊杰在中科院的校友杨斌，他是MiniMax的联合创始人和技术合伙人，曾是Uber ATG研究院和自动驾驶初创公司Waabi的创始成员。
去年，原今日头条产品负责人张前川也加入了MiniMax，现在担任公司负责人。
技术和产品：
MiniMax自主研发了文本到视觉、文本到语音和文本到文本三个基础模型架构，并构建了一个计算推理平台。
公司早期产品包括：
Glow：面向虚拟聊天领域的应用，用户可以创建有背景设定、特定性格的智能体。Glow已对外开放API接口。
Inspo：生成式对话AI，基于Transformer，具备写作、获取信息、提供建议等能力。
星野：AI社交应用，主打陪伴属性。
投资和合作：
MiniMax吸引了众多投资人的注意，包括阿里、腾讯、米哈游、IDG资本和高瓴。
公司估值在不到一年的时间内翻了一番，目前是国内估值最高的AIGC独角兽之一。
MiniMax的发展势头迅猛，不仅在技术上有所突破，还在合作伙伴和投资方面取得了不小的成就。¹ ² ³