最近中文模型开启了内卷,价格已经到了很低的水平,给大家整起。
快速入口在我的主页上都是有的 https://pipers.cn
密码是我的微信名。
文心一言-百度
文心一言(英文名:ERNIE Bot)是百度公司开发的一款人工智能语言模型。它基于文心大模型技术推出,是百度在人工智能领域深耕十余年后,拥有产业级知识增强文心大模型ERNIE的基础上,利用跨模态、跨语言的深度语义理解与生成能力而开发的一款AI聊天机器人1。
文心一言具备多项功能,包括:
文学创作:可以帮助你写文案、想点子,提供创意和灵感。
商业文案创作:支持撰写邮件、广告文案等商业用途的文案。
数理逻辑推算:具备数学、逻辑推理能力,可以处理数据、编写代码等。
中文理解:能够理解中文输入,回答问题,进行对话互动。
文心一言的应用领域广泛,包括搜索问答、内容创作生成、智能办公等。作为一个智能伙伴,它能够高效便捷地帮助人们获取信息、知识和灵感3。如果你有其他问题或需要更详细的介绍,欢迎继续提问!1
阿里通义千问
通义千问(英语:Tongyi Qianwen)是由阿里巴巴集团旗下的云端运算服务科技公司阿里云开发的聊天机器人。它能够与人互动、回答问题以及协作创作1。通义千问主要定向邀请企业用户进行体验测试,仅允许获得邀请码的企业用户在官网加入体验,需要登录阿里云账号2。
通义千问意在“通情,达义”,具备全副AI能力,致力于成为人们的工作、学习、生活助手。它的功能包括多轮对话、文案创作、逻辑推理、多模态理解、多语言支持,能够与人类进行多轮的交互,也融入了多模态的知识理解,且具备文案创作能力,例如续写小说、编写邮件等3。
通义千问的发展历程包括:
2023年4月7日,通义千问开始邀请测试。
2023年9月13日,通义千问大模型正式向公众开放,其APP在各大手机应用市场上线,所有人都可通过APP直接体验最新模型能力。
最新消息:2024年6月7日,阿里通义千问Qwen2大模型发布,涵盖多个尺寸的预训练和指令微调模型,上下文长度支持进一步扩展,最高达128K tokens5。
deepseek
根据deepseek Github官方的描述
DeepSeek 是由量化巨头幻方开发的一款大模型,旨在探索通用人工智能(AGI)。让我为你详细介绍一下:
公司背景:
成立日期:2023年7月17日。
DeepSeek Coder:
第一代大模型,已开放内测。
功能:
快速编写Python程序。
修改用户界面(UI)。
测试程序中的错误(bug)。
数据分析。
学习SQL数据库语言。
性能:
70亿参数版本的DeepSeek Coder在代码能力上达到了CodeLlama的340亿参数水平。
探索AGI:
阶跃星辰
阶跃星辰(英文名:LeapStar)是由微软前全球副总裁姜大昕创办的国内基础大模型创业公司1。虽然成立于2023年,但直到最近才正式发布产品,这家公司一直保持低调。
创始人和背景
产品
阶跃星辰已经推出了两款面向C端市场的应用,分别是:
大模型成就
阶跃星辰已经成功研发了两款千亿参数大模型:
零一万物
零一万物(英文名:LeapStar)是由创新工场和前百度副总裁马杰共同创建的AI大模型研发商1。总部位于北京,该公司集中在大模型技术、人工智能算法、自然语言处理、系统架构、算力架构、数据安全和产品研发等领域2。
零一万物致力于自研大模型,自建平台,构建数千卡GPU集群进行训练、调优和推理,以提高数据有效参数量,构建连续、可控、科学化的训练能力1。该公司已经实现了百亿参数规模的模型内测,并计划推出开源的模型版本1。
李开复博士亲自带队,塔尖孵化的AI2.0公司,零一万物正是这家创业公司的正式名称3。4
零一万物的目标是走向通用人工智能(AGI),为多模态、长文本理解提供更好的解决方案,以实现“零一智能,万物赋能”的雄心3。1
百川大模型
百川大模型是由百川智能推出的大模型产品。该公司成立于2023年4月10日,由搜狗公司创始人王小川和前搜狗COO茹立云联合创立,旨在打造中国版的OpenAI基础大模型及颠覆性上层应用1。
百川大模型融合了意图理解、信息检索以及强化学习技术,结合有监督微调与人类意图对齐,在知识问答、文本创作领域表现突出2。该公司已发布多款大模型,包括Baichuan-7B、Baichuan-13B、Baichuan-53B等,其中Baichuan 3更是超千亿参数的大语言模型3。
百川智能的使命是帮助大众轻松、普惠地获取世界知识和专业服务,构建中国最优秀的大模型底座。
腾讯大模型 2024-07-01 已过期
腾讯混元大模型是由腾讯研发的通用大语言模型,拥有超万亿参数规模,具有强大的中文理解与创作能力、逻辑推理能力,以及可靠的任务执行能力1。这一大模型支持广泛的功能,包括图片生成、文案创作、文字辨识,以及客户服务等,将在金融、公共服务、社交媒体、电子商务、交通运输、游戏等产业发挥重要作用2。腾讯今年6月推出的模型即服务(MaaS)让企业可以训练自己独有的大模型,而混元让企业有能力打造出功能强大的工具2。此外,腾讯云联合22家客户启动了行业大模型共建合作,为传媒、文旅、政务、金融等10余个行业提供超过50个大模型行业解决方案3。4
moonshoot
Moonshot AI 是一家神秘而备受关注的大模型创业公司。其创始人是清华大学交叉信息学院的杨植麟教授,他曾在FAIR和Google Brain工作,并是Transformer-X和XLNet论文的第一作者1。这两篇论文在深度学习领域产生了深远影响。不过,杨植麟的人生并非一帆风顺。从小学到博士阶段,他都克服了许多挑战,成为了一位杰出的学者和创业者。
Moonshot AI 致力于研发下一代跨模态大模型。他们的首个产品是名为 Kimi Chat 的智能助手,支持输入20万汉字的上下文,具备强大的多语言能力2。相比以英文为基础训练的大模型,Kimi Chat在中文上表现出色,实际使用效果超过了其他同类产品2。
此外,Moonshot AI 还发明了一些重要的技术组件,如RoPE相对位置编码和group normalization,为大模型的研发和应用做出了贡献3。他们的目标是让AI等待时间成为过去,让先进的算法服务于更广泛的用户群体,包括肤癌研究、疫苗开发、股市预测等领域4。5
星火大模型
星火大模型(英文名:LeapStar)是由科大讯飞推出的新一代认知智能大模型1。这一大模型拥有跨领域的知识和语言理解能力,能够基于自然对话方式理解与执行任务,提供语言理解、知识问答、逻辑推理、数学题解答、代码理解与编写等多种能力1。
创始人和背景:
应用领域:
星火大模型的目标是走向通用人工智能(AGI),为多模态、长文本理解提供更好的解决方案,助力各行各业的数字化转型和智能化应用1。23
质谱清言
智谱清言 是由北京智谱华章科技有限公司推出的生成式AI助手,于2023年8月31日上线1。这一中文对话模型基于智谱AI自主研发的中英双语对话模型ChatGLM2,经过万亿字符的文本与代码预训练,并采用有监督微调技术,以通用对话的形式为用户提供智能化服务1。
主要功能包括:
通用问答:回答用户各类问题,涵盖众多领域,提供实时、准确的信息和解决方案。
多轮对话:具备出色的对话能力,可以与用户进行自然、流畅的多轮对话,提供高效的沟通体验。
虚拟对话:根据用户需求扮演不同角色,增强互动性和用户体验。
创意写作:为用户的创作需求提供脑暴灵感、内容框架以及高质量的文案,提升写作效率和质量。
MinMax
MiniMax 是一家成立于2021年12月的大模型初创公司,专注于开发AI解决方案。让我为你详细介绍一下:
创始人和背景:
MiniMax由前商汤科技副总裁、商汤科技研究院副院长、通用智能技术负责人闫俊杰创立。
另一名核心成员是闫俊杰在中科院的校友杨斌,他是MiniMax的联合创始人和技术合伙人,曾是Uber ATG研究院和自动驾驶初创公司Waabi的创始成员。
去年,原今日头条产品负责人张前川也加入了MiniMax,现在担任公司负责人。
技术和产品:
MiniMax自主研发了文本到视觉、文本到语音和文本到文本三个基础模型架构,并构建了一个计算推理平台。
公司早期产品包括:
Glow:面向虚拟聊天领域的应用,用户可以创建有背景设定、特定性格的智能体。Glow已对外开放API接口。
Inspo:生成式对话AI,基于Transformer,具备写作、获取信息、提供建议等能力。
星野:AI社交应用,主打陪伴属性。
投资和合作:
MiniMax吸引了众多投资人的注意,包括阿里、腾讯、米哈游、IDG资本和高瓴。
公司估值在不到一年的时间内翻了一番,目前是国内估值最高的AIGC独角兽之一。