时间很快,就到了星海科技发布会的前两天。
这天,星海科技在做发布会前最后的准备。
首先是发布会现场,此时已经全部布置完成了。
接下来只需要对现场的设备进行调试,没有问题后就可以了。
这次的发布会还是和以前一样,会通过线上和线下同时举行。
不过与之前不一样的是,星海科技这次准备完全使用手机进行直播。
而直播使用的手机,就是最新款的荣誉手机。
当然了,在发布会结束之前,不管是参加发布会的线下观众,还是观看发布会直播的网友,都不会知道。
星海科技这样做,除了展示荣誉手机出色的性能。
同时,也是为了给观众们一个惊喜。
在视频拍摄领域,其实国产的手机并没有什么优势。
所以一般情况下,开直播都是使用的平果手机。
但是荣誉手机如今在视频拍摄领域已经取得了突破。
如果这次可以顺利的把现场直播进行下去,还表现非常出色的话。
绝对可以证明荣誉手机在直播和拍摄领域稳定和高超的性能。
这也是周末想起来,最简单直接证明荣誉手机拍摄性能的方法了。
第二个准备好的就是荣誉手机了。
由于星海科技的芯片工厂搭建进度晚了一点,所以导致在发布会前的最后一个月,星海科技的芯片工厂才完成芯片生产。
虽然时间上看似有点着急,其实完全来得及。
星海科技的芯片工厂的芯片生产速度可是要比台积电快的多。
而荣誉手机这边,其他零部件都准备好了。
所以当星海科技的芯片工厂把芯片生产出来,把芯片运输到跃龙集团,很快就生产出了一台荣誉手机。
到目前为止,荣誉手机公司一共准备了500万台的各种类型的荣誉手机。
其中有直板机,也有折叠屏。
荣誉手机公司这次准备的其实不是太多,主要原因还是担心用户对于他们的手机价格接受不了。
折叠屏天生就比较贵,愿意买的也少。
就算荣誉的折叠屏手机已经解决了折叠屏的痛点。
但是依然会有很多人不会购买这样的手机。
除此之外,荣誉手机的直板机,配置也拉满了。
到时候,价格肯定不会便宜。
荣誉手机公司在以前,成立是为了和黑米打擂台。
所以荣誉手机突然走高端市场,很多人可能并不会认可。
不过,星海科技这次发布会准备由真正的实力让对方认可!
而且,这些后面生产的芯片,性能相对于赵鹏拿走的进行测试的芯片会更加稳定和强悍。
这是因为在芯片工厂搭建好之前,星海科技是借用杨英宇他们的场地进行的测试生产。
在那个时候,生产出来的芯片性能要低一些。
但是仅仅是那次测试的芯片,就已经要领先目前市面上的芯片性能了。
而在星海科技芯片工厂搭建好之后,芯片性能更加强悍,也就意味着荣誉手机的性能更加强悍。
周末相信,就算是不喜欢荣誉手机的人。
在得知荣誉手机的性能后,肯定也会为之刮目相看。
接下来,就是显卡和星云聊天机器人了。
在目前市面上,还没有太多公司发现显卡的重要性。
也没有人意识到,显卡是大模型训练非常重要的一个关键点。
不过,只要星海科技在发布会上推出了星云聊天机器人。
周末再介绍如何对聊天机器人进行训练后。
周末相信,购买他们公司先开的肯定会乐绎不绝。
显卡对于大模型至关重要,是大模型训练与部署的基石。
显卡可以提供强大并行计算能力。
AI模型训练本质上是大量矩阵乘法和张量计算。
与传统cpU相比,GpU能够并行处理数以千计的计算任务。
其通过成百上千个cUdA核心并行处理,在矩阵运算上效率远超cpU。
例如,一张NVIdIA A100显卡的浮点运算能力可达312 tFLopS,是传统高端cpU的几十倍。
大模型的参数和训练数据往往无法装载在一块显卡的显存中,需要借助多GpU集群进行训练。
此时,显卡的通信性能成为影响训练效率的关键。
支持多卡并行的显卡架构,如NVIdIA的NVLink技术,使得多GpU之间的通信延迟大幅降低,模型切分更加高效。
为了满足大模型对显存的高需求,AI大模型通常需要占用大量显存。
例如,训练一个130b参数规模的语言模型,至少需要每卡80Gb以上的显存,否则很难存储前向传播和反向传播的梯度数据。
高端GpU和消费级GpU都在支持模型训练方面发挥着不同程度的作用。
模型训练完成后,进入推理部署阶段,虽然对算力的要求相对较低,但响应速度、并发请求能力、功耗等因素对GpU提出了新的要求。
例如利用INt8量化后,Gpt-3模型能在仅16Gb显存的显卡上运行,极大降低了对硬件的依赖。
目前市面上,最先进的显卡就是星海科技的显卡。
当然了,星海科技在最初,使用的还是英伟达的显卡。
周末通过自己的指点,让研发人员提前好几年研发出了用更少的算力来实现大模型的训练。
这在后来,也是非常恐怖的发现。
因为要知道,那个时候,阿美莉卡都准备对全球输出算力了。
可是最终,在2025年初的时候,直接被东大的dS给打懵了。
dS-V3是dS于2024年12月26日发布的模型,其基座模型采用了混合专家机制,总共有6710亿参数。
该模型在2048块英伟达h800 GpU集群上完成训练,在阿美莉卡数学竞赛和全国高中数学联赛上大幅超过其他所有开源闭源模型,生成吐字速度从20tpS大幅提高至60tpS。
dS-R1是基于dS-V3 base基座模型,通过纯强化学习方法训练出来的推理模型。
deepSeek团队仅用29.4万美元和极短的训练时间就训练出了该模型,极大地降低了顶级AI模型的研发门槛。
dS最终证明了,训练大模型根本不需要这么多功能强大的显卡!
dS训练大模型使用的算力,只是meta的1\/11,甚至十分之一都不到。
但是dS的性能却赶上了世界先进水平。
不过其他公司并不知道这种情况。
这就给了星海科技收割其他科技公司的机会!
星海科技这次可不会手软的!