Address
:
[go:
up one dir
,
main page
]
Include Form
Remove Scripts
Accept Cookies
Show Images
Show Referer
Rotate13
Base64
Strip Meta
Strip Title
Session Cookies
More Web Proxy on the site http://driver.im/
飞书服务商
产品
产品
为广大中小企业提供多场景解决方案,满足各行业客户在不同发展阶段的业务需求,快速实现数字化转型。
移动办公
Android
IOS
小程序
企微CRM
桌面客户端
Windows
Mac
悟空CRM&协同办公
悟空CRM
悟空CRM X 企业微信
悟空CRM X 飞书
悟空SCRM
悟空呼叫中心
APP移动办公
悟空AI工具箱
科创数字化
悟空投资管理系统
OA&协同办公
悟空财务FS
悟空人资HRM
悟空项目管理PM
悟空知识库
悟空邮箱
Guanxi
ERP&产业互联网
悟空ERP
悟空进销存
悟空智慧农业
悟空商城
悟空智慧物流
无代码引擎
悟空无代码
悟空BI
应用市场
应用市场
悟空应用市场与生态伙伴通过产品级融合,为客户提供全面、专业、领先的产品及解决方案,共建产业互联。
前往应用市场 >
CRM/营销/服务
客户关系管理系统
合同管理
4S店客户管理系统
售后工单
维修工单管理
运营售后
IT技术服务
ITSM
物流派件跟踪系统
HR人力资源
人事管理
会议管理
办公用品管理
车辆管理
项目管理
工程项目投标管理
投资项目管理
工程投标管理
投资管理系统
财务管理
费控系统
行业方案
校务管理
物业管理(住宅式)
律所管理系统
门店业绩上报
智慧党建系统
教培管理
校园后勤管理
医院管理系统
ERP与供应链
供应链管理系统
生产进销存
批发零售业管理
健康安全环境管理系统
进销存管理系统
QMS(质量管理系统)
产品生命周期管理
经销商管理
供应商管理系统
产品数据管理
解决方案
解决方案
无论何时何地,悟空云各领域专家就在您身边
前往解决方案 >
教育培训业
教育行业
旅游业
旅行社行业
宾馆酒店行业
家电汽车业
家电行业
汽车行业
互联网金融业
互联网行业
风险投资行业
金融租赁行业
商业零售业
食品行业
餐饮行业
贸易行业
制造行业
快消品行业
美妆服饰业
服饰行业
美妆护肤行业
服务业
农牧农资行业
咨询服务行业
律师行业
物业管理行业
代理注册行业
物流行业
房地产建材业
房地产行业
装饰装修行业
会展行业
家居建材行业
医疗器械业
医院行业
保险行业
医疗器械行业
定价
服务与支持
服务与支持
无论何时何地,悟空云各领域专家就在您身边,帮助您提升业务价值。
设计服务
设计服务
文档与工具
文档中心
入门指南
视频中心
社区
基础服务
在线支持
常见问题中心
客户端下载
Android下载
Ios下载
Windows下载
Mac下载
合作与生态
合作与生态
悟空云始终保持着开放的态度,发挥自身多年的行业能力积累,为生态伙伴赋能。
合作伙伴
合作伙伴
推广奖励
推广奖励
了解悟空
了解悟空云
悟空云,提供全球领先的云计算、大数据、人工智能等技术产品与服务,以卓越的科技能力打造丰富的行业解决方案,构建开放共赢的合作生态,推动产业互联网建设,助力各行各业实现数字化升级。
品牌介绍
关于悟空
新闻活动
行业资讯
产品动态
公司新闻
客户案例
精选客户案例
一体机 (WSS)
WODN
更多
了解悟空
合作与生态
服务与支持
免费注册
用户登录
企业微信
企业微信在线客服
售前咨询
电话咨询
在线体验
开源下载
加入社区
客服热线
400-0812-558
每天9:00 - 18:00
扫码加入悟空社群
返回
Baichuan-7B
4.8(386)
问题反馈
本地部署
baichuan-7B 是由百川智能开发的一个开源可商用的大规模预训练语言模型。基于 Transformer 结构,在大约1.2万亿 tokens 上训练的70亿参数模型,支持中英双语,上下文窗口长度为4096。在标准的中文和英文权威 benchmark(C-EVAL/MMLU)上均取得同尺寸最好的效果。
产品信息
视频介绍
评论(4)
## 一、开源的Baichuan-7B: baichuan-7B 是由百川智能开发的一个开源可商用的大规模预训练语言模型。基于 Transformer 结构,在大约1.2万亿 tokens 上训练的70亿参数模型,支持中英双语,上下文窗口长度为4096。在标准的中文和英文权威 benchmark(C-EVAL/MMLU)上均取得同尺寸最好的效果。 ## 二、数据: 原始数据包括开源的中英文数据和自行抓取的中文互联网数据,以及部分高质量知识性数据。 参考相关数据工作,频率和质量是数据处理环节重点考虑的两个维度。 我们基于启发式规则和质量模型打分,对原始数据集进行篇章和句子粒度的过滤。在全量数据上,利用局部敏感哈希方法,对篇章和句子粒度做滤重。 整体流程如下所示: ![](https://www.5kcrm.com/center/public/uploads/20230618/cc4c73ef3ba689c0b4c2113a669936f6.png) 经过不断的调整和多轮测试,最终确认了一个在下游任务上表现最好的中英文配比。 使用了一个基于自动学习的数据权重策略,对不同类别的数据进行配比。 # 三、分词: 我们参考学术界方案使用 SentencePiece 中的 byte pair encoding (BPE)作为分词算法,并且进行了以下的优化: 目前大部分开源模型主要基于英文优化,因此对中文语料存在效率较低的问题。我们使用2000万条以中英为主的多语言语料训练分词模型,显著提升对于中文的压缩率。 对于数学领域,我们参考了 LLaMA 和 Galactica 中的方案,对数字的每一位单独分开,避免出现数字不一致的问题,对于提升数学能力有重要帮助。 对于罕见字词(如特殊符号等),支持 UTF-8-characters 的 byte 编码,因此做到未知字词的全覆盖。 我们分析了不同分词器对语料的压缩率,如下表,可见我们的分词器明显优于 LLaMA, Falcon 等开源模型,并且对比其他中文分词器在压缩率相当的情况下,训练和推理效率更高。 Model baichuan-7B LLaMA Falcon mpt-7B ChatGLM moss-moon-003 Compress Rate 0.737 1.312 1.049 1.206 0.631 0.659 Vocab Size 64000 32000 65024 50254 130344 106029 # 四、模型结构 整体模型基于标准的 Transformer 结构,我们采用了和 LLaMA 一样的模型设计 位置编码:rotary-embedding 是现阶段被大多模型采用的位置编码方案,具有更好的外延效果。虽然训练过程中最大长度为4096,但是实际测试中模型可以很好的扩展到 5000 tokens 上,如下图: ![](https://www.5kcrm.com/center/public/uploads/20230618/f377d965ea6c7d4d172f3e2b9f5098e2.png) 激活层:SwiGLU, Feedforward 变化为(8/3)倍的隐含层大小,即11008 Layer-Normalization: 基于 RMSNorm 的 Pre-Normalization # 五、训练稳定性和吞吐 我们在原本的LLaMA框架上进行诸多修改以提升训练时的吞吐,具体包括: 算子优化技术:采用更高效算子,如 Flash-attention,NVIDIA apex 的 RMSNorm 等。 算子切分技术:将部分计算算子进行切分,减小内存峰值。 混合精度技术:降低在不损失模型精度的情况下加速计算过程。 训练容灾技术:训练平台和训练框架联合优化,IaaS + PaaS 实现分钟级的故障定位和任务恢复。 通信优化技术,具体包括: 采用拓扑感知的集合通信算法,避免网络拥塞问题,提高通信效率。 根据卡数自适应设置 bucket size,提高带宽利用率。 根据模型和集群环境,调优通信原语的触发时机,从而将计算和通信重叠。 基于上述的几个优化技术,我们在千卡A800机器上达到了7B模型182Tflops的吞吐,GPU峰值算力利用率高达58.3% 。 最终的loss如下图 ![](https://www.5kcrm.com/center/public/uploads/20230618/02087965d3550797f6aa3d46f69f58a0.png) ## 三、安装使用方法: ### 1、下载Baichuan-7B一键部署安装包 百度网盘下载地址:[百度云](https://pan.baidu.com/s/1BRz4pECm7AKSzUWylZTAGw?pwd=BM9r "百度云") 链接:https://pan.baidu.com/s/1BRz4pECm7AKSzUWylZTAGw?pwd=BM9r 提取码:BM9r ### 3、一键运行 下载完成后,点击文件中的run.bat直接一键运行 运行完成后,即完成本地化Baichuan-7B安装,您可以直接进行使用。
视频介绍
4条评论
写评论
登录/注册悟空账号
登录悟空账户,您可以发表关于AI的相关问题,我们会及时为您解答。
发送验证码
评论
*
查看更多
微信扫码加入社群
热门文章
如何估计大模型所需要的显存大小?HuggingFace发布Model Memory Calculator
快速了解GLM-130B和ChatGLM
教你使用开源 Hugging Chat 部署『生产级』私有 AI 聊天应用
LangChain:2023 最新的 AI Web框架
ChatGPT系列论文精读——大模型经典论文GPT1、GPT2、GPT3
ChatGPT4.0账号被封?这5款著名网站可完美替代
基于大模型生成PPT、Word和网页的新产品测试~Gamma.APP
让「ChatGPT」们爆火的 LLM 模型到底是什么?
ChatGPT4.0上线 Canva 插件!可高效制作图片和视频内容!
电商AI换脸“迪丽热巴 杨幂”卖货:效果以假乱真!或涉嫌侵犯肖像权
其他AI工具
GPT Academic
4.8(386)
VisualGLM
4.8(386)
Stable Diffusion
4.8(386)
ChatGLM
4.8(386)
WebGLM
4.8(386)
LangChain-ChatGLM
4.8(386)
ChatGLM2-6B
4.8(386)
LangChain-ChatGLM2
4.8(386)
DragGAN
4.8(386)
Llama2
4.8(386)
完成以下信息即可体验开源版(悟空CRM)
更先进的技术架构、更漂亮的界面、更清爽的布局完全开源
获取验证码
立即体验
信息提交成功!
工作人员会在48小时之内进行信息审核,
审核结果将会发送到您的手机,请注意查收
好的
请选择登录版本
更先进的技术架构、更漂亮的界面、更清爽的布局完全开源
版本
新10.0版本