随梦书屋 通过搜索各大小说站为您自动抓取各类小说的最快更新供您阅读!

第312章 历景铄的神经网络模型进展

有了燧火这么一个趁手的算法工程工具,历景铄的神经网络算法研发进度可谓突飞猛进。

两个月前,经过多次尝试,他成功复现了当下学界比较流行的感知机神经网络训练结果,在手写数字识别任务上,已经达到了百分之七十的正确率。

这一成果在国内研究环境中,已然十分亮眼,但历景铄的目光并未就此满足,他深知前路漫漫,还有更多的未知等待探索,于是赶忙找到秦奕开始认真商量下一步的探索方向。

神经网络算法模型的研发有三大关键要素:数据、模型和优化算法。

在神经网络体系中,数据是极为重要的基础部分,数据的质量优劣、规模大小以及多样性程度,对模型的学习能力与泛化能力有着全面且关键的影响。

当数据足够多样时,模型便不会局限于学习某一类特定的数字特征,而是可以提炼出更具通用性、更普遍适用的特征模式,从而在面对从未见过的新数字样本时,也能准确识别。

但要是数据存在偏差,比如手写数字识别任务里的数据某些数字样本数量过多,而另一些过少,模型在学习时就会过度倾向于数量多的数字特征,使得对其他数字的识别能力大幅下降,严重损害泛化性能。

历景铄为了方便对比漂亮国学术界的研究成果,一开始没有去耗费大量精力构建自己独有的数据集,用的是漂亮国现成的数据集——漂亮国国家标准与技术研究院的公开 NISt 手写数字数据集。

这个数据集是前世被广泛应用于学术研究和工业实践中的手写数字识别领域基准测试数据集 mNISt 的前身,每个样本都是 28x28 像素的灰度图像,代表0 - 9之间的一个数字。

不过 mNISt 数据集包含六万个训练样本和一万个测试样本,而目前 NISt 数据集目前只有两万个训练样本和五千个测试样本。

随后,话题转到模型架构上,这是历景铄目前希望改进的重点。

他拿起一支笔,在纸上简单画了个神经网络结构草图,说道:“模型架构是神经网络的核心,具体分为网络结构和参数两大部分。”

“网络结构说白了,就是神经网络怎么组织,有几层,每层是什么类型,连接方式如何,信息又是怎么在各层之间流动,这是神经网络的‘骨架’,决定了网络的功能和适用场景。”

“网络参数呢,就是神经网络里要学习的权重和偏置,决定了网络怎么从输入数据里提取特征、做出预测。”

“现在学术界流行的多层感知机神经网络,是一种前馈神经网络,结构有输入层、隐藏层和输出层,神经元基本都是全连接。”

“我用的也是相同的结构,在处理 28x28 像素图像的时候,得把图像数据所有像素先展平成一维 784 长的向量数据,然后从输入层一层一层传到输出层,每层通过权重矩阵和激活函数做非线性映射。”

秦奕凭借前世的经验直接指出了当下多层感知机神经网络的缺点所在:“我觉得这个多层感知机这个神经网络目前至少有两个方面可以改进。”

“首先,它的每个神经元都得和上一层的所有神经元相连,这会导致整个神经网络的参数数量是网络层数的 784 倍,这么庞大的参数数量,会导致训练过程特别缓慢,还特别容易引发过拟合问题。”

“其次,因为它需要将所有像素展开成一维数据,这样会将原本图像数据中的笔画或者边缘这种特征丢失。”

历景铄听着,眼睛渐渐亮了起来,若有所思地说:“你是觉得我们可以适当减少不同层之间的网络连接,同时把保留输入数据的二维结构,接着在隐藏层里面针对二维矩阵进行学习?”

他突然一拍大腿,兴奋地说:“有了!我之前看到过瀛国科学家福岛邦彦的一篇论文,他好像就有差不多的思路!” 说着,他快步走到那堆论文文件夹前,手忙脚乱地翻找起来,嘴里还嘟囔着:“在哪呢,到底放哪了……”

找了好一会儿,终于翻出一篇题为? Neocognitron? 的论文,他连忙拿到秦奕面前,说:“秦哥,你看这篇名叫新认知机的论文,里面提出了局部感受野和层次化特征提取的思想。”

“他的网络结构包含 S 层和 c 层,S 层也就是简单细胞层用卷积操作提取局部的二维空间特征,c 层复杂细胞层则整合 S 层中一组简单细胞的输出,提取更高级的特征,这能在一定程度上减少网络里的参数。”

他赶紧去自己那一堆论文文件夹里面翻找了一番,然后拿出了一篇题为 ?Neocognitron? 的论文给秦奕看:“这篇名叫新认知机的论文里面就提出了局部感受野和层次化特征提取的思想。”

“他的网络结构包含 S 层和 c 层,其中 S 层也就是简单细胞层用卷积操作提取局部的二维空间特征,而 c 层的复杂细胞层,整合 S 层中一组简单细胞的输出,提取更高级的特征,这一定程度上能减少网络里面的参数。”

秦奕接过这篇远没有杨立昆 89 年发表的卷积神经网络出名的论文,快速略读了一遍。

读完后,他发现里面的网络结构设计确实是跟后来引入了卷积层和池化层的卷积神经网络基本一致,只是因为这篇论文用的是无监督学习所以难以处理复杂的分类任务。

无监督学习和有监督学习是机器学习的两种主要范式,有监督学习使用标注过的数据即输入数据和对应的输出标签来训练模型,模型的目标是学习输入与输出之间的映射关系,无监督学习使用未标注数据来训练模型,模型的目标是发现数据中的潜在结构或模式。

秦奕点了点头说道:“我觉得这确实是一个很好的网络结构设计思路,我们可以把有监督学习和他这个网络结合起来,说不定就能在手写数字识别任务上取得突破。”

“另外,神经网络虽说是借鉴生物结构,但网络层命名也没必要弄得这么像生物术语,简单细胞和复杂细胞听起来都不知道是做什么的,我建议直接用操作命名就行,做卷积操作的叫卷积层,做池化操作的叫池化层,这样交流起来方便。”

“可以。”历景铄应道,“另外优化算法方面我们这边也遇到了一些问题。”

随梦书屋推荐阅读:豪婿韩三千我在霸总文里直播普法重生八零甜蜜军婚我老婆是冰山女总裁镇国战神叶君临李子染特战医王80年代剽悍土着女从996到古代文娱策划大师我家有绝世女战神商界大佬想追我战神归来叶君临都市之最强狂兵完整版最新章官缘从挂职干部开始到高位最强狂兵陈六何沈轻舞皇后是朕的黑月光都市仙尊洛尘叶辰夏若雪孙怡最新章节能与动物交流助他成为特种兵王追美高手大戏骨霸天龙帝沈浪叶辰夏若雪是哪部小说的男主角官场先锋爱你成瘾偏执霸总的罪妻[红楼+倩女幽魂]目标!探花郎离婚后前妻成债主第二季洋哥,你还缺个助手重生之农女当自强我的绝色总裁未婚妻(又名:神级龙卫)重生之芬芳人生红楼之魔门妖女回到过去当富翁激活男神系统的我被倒追很正常吧?都市之罗小黑传奇罪鬼之证重生八零,团宠娇娇医手遮天目标!探花郎重生七零奋斗媳龙婿陆凡小说免费阅读今世猛男陈六何沈轻舞重生88,从大山挖参开始!我智商开挂,戏耍灭世Ai帝王病弱将军的团宠田妻飒爆了最强狂兵陈6合神级护卫麻衣神婿陈黄皮叶红鱼重启2008:从拯救绝色女老师开始逆袭重生八零之家有小悍妻凌依然阿瑾
随梦书屋搜藏榜:带着包子去捉鬼从陵墓中苏醒的强者大小姐偷偷给我生个娃独宠名门前妻女配升级攻略:医蛊王妃农家丑妻宋不凡的超级系统怕什么,我有无敌空间洛少霸道:娇妻哪里逃被渣后她嫁给了九千岁兵之王者契约农妃的马甲又被扒了什么流量艺人,我是实力派山村野花开神说你要对女人负责极品龙婿终极一班:重生成雷克斯重生之丁二狗的别样生活异界之学徒巫妖和步行骑士过气歌手出走半生,归来仍是巨星万古长空一朝风月重生之人渣反派自救系统高山果园炼狱孤行者转生成兽娘被神收编了陌上花开我要当影后保护校花半世浮生半世殇重生八零我每天靠败家躺赢敢霸凌我妹妹:那就杀个痛快!闹婚之宠妻如命极品警察穿越之黎明的秦重生之低调富翁他似春火燎原娱乐:表白失败后,拒绝当舔狗!小青梅她有点难追转职人皇,技能变态点很合理吧穿成癌症老头,还好我有遗愿清单前妻好可口:首席,别闹男神娇宠之医妻通灵民国,我在淞沪打造特战旅弃妃无双[综+剑三]明眸善媚都市妖孽狂兵灵启都市纪元:佣兵的平凡幻变灵气复苏:我走向无敌路他今夜又来撒野了这只皇帝会读心穿书后我渣了偏执大佬
随梦书屋最新小说:我的自爆,可升级为禁忌武器女尊:极端失衡直播:他就不会荒野求生!纯命硬玄道无涯章语管顶罪五年,出狱后全球警戒!都市与修仙世界的双穿就是爽指挥使,战姬进化路线不对劲!港综:无敌金刚,港女星臣服报告首长,99年的事情瞒不住了三界大钦差特种利刃尖兵我在职场开挂逆袭封神我只想安静地当具尸体官道之巅断绝关系后,我觉醒了SSS级职业!最强天劫:我在都市收服神魔妖魔乱世,五旬保安守家园美食从系统:摆摊开始和女总裁同居后开始失控人生剑魔修炼职场真龙:我的九五至尊模拟器我在都市卖灵果:靠捡漏水果暴富铁血狂卫重生1958:猎豪把妻女宠心尖上!医武神眼高冷校花带两个萝莉女儿喊爸爸四合院:侄子门前站,不算绝户汉桃花林里桃花香我是你们白月光?不是绿茶男二吗穿越到抗战年代的孟飞娶天后老婆,我在娱乐圈痴情成神重生后,我的美食引来万界众人,重回1983:开局断亲,迎娶克夫女都市大反派,我身边都是心机婊港综:从抢陈浩南车开始崛起手艺人修仙指南神豪:开局打赏梦泪媳妇卡牌封灵:灵气复苏时代港片:老婆何敏,黑丝要抱抱解约后,我成为曲神,你后悔什么重生末世:雷帝逆袭系统小山村爱恨情仇风水相师:我的网恋女友是总裁带着随身空间重生70年代德鲁伊下水道?管我绝活什么事青春往事傻子神医狂少出狱,已是武道宗师温柔剑修没脾气,开局绑定小萝莉