第268章 最终版本

所谓集成学习,就是训练多个机器学习模型,然后组合在一起,让它们协调工作。

俗话说,人多力量大,机器学习算法也是一样。

江寒经过一番认真的设计,确定了一个新的网络拓扑结构。

他从排名4~15的模型里,精心选择了7种,再加上“唯一优胜者”、“黑马中等生”、“书呆子”,一共10个神经网络。

将它们放在一起,简单地并联起来,组成了一个整体,然后设计了一个投票程序。

一张手写数字的图片输入网络后,会同时传递给10个神经网络模型,让它们各自进行计算,输出自己的预测结果。

如果大家的判断完全一致,那自然没什么问题。

但如果大家意见相左,就会启动投票程序,根据票数来决定最终的输出。

票数并不是平均分配的,在验证集上表现更好的模型,手里的选票也应该更多。

所以,理所当然的,“唯一优胜者”拥有最多的票数。

如果他全票投给自己,那么一般来说,他的意见就基本上接近正解,理应得到采纳。

这种情况下,其他模型就算有不同意见,而且全都统一口径,也不应该推翻优胜者的判断。

这就好比领导班子开会,不能光讲民主,还得适当集中……

但很多时候,优胜者对自己的判断,也并不是十分有把握,这个时候,其他“学生”给出的答案,就很有参考意义了。

如果其他人中,有人认为答案是另一个,并得到了多数人的支持,那么就会对优胜者的答案进行“弹劾”。

如果优胜者投给自己的票数,并不足以驳回大家的“弹劾”,那么就会少数服从多数,将最后输出修改为受到更多人认同的。

举例来说,刚才的那个数字5。

优胜者判断有60%的概率是6,37%的概率是5,2%的可能性是其他数字,这个时候,它就会输出错误的答案:6。

但如果在其他“学生”中,有人经过计算,认为答案应该是5,与优胜者判断不一致,就会启动投票程序。

由于优胜者判断只有60%的概率是数字6,折算后,等于它只肯为自己的答案投6票。

这个时候,只要其他9个模型的票数,加一起超过6票,即可弹劾成功。

如果优胜者对自己的判断,有90%以上的把握,那么其他9个人加起来,也不足以推翻他的结论。

意思就是这么个意思,具体的折算比例,当然不会这么简单。

还需要十分细致、耐心地进行调整,以使整个模型的输出,更加接近最优解。

当然,这种投票式的做法,无疑也有极小极小的可能性,产生不那么美好的结果。

比如,优胜者本来的判断明明是正确的,只是对自己信心不够充足,也有可能被其他模型给“纠正”成错误的。

但这种情况发生的几率,远远小于优胜者误判的几率。

所以,集成学习的总体性能,仍然领先于每一个单独的神经网络。

这种集成学习的思想,无疑是比较先进的,但实现起来难度也相当大。

尤其是那个投票程序,相当耗费脑细胞。

江寒全力开动脑力,也足足用了四个多小时,才将集成学习网络打造成功。

时间主要浪费在编写投票程序,以及调整折算比例上了。

至于10个子模块,已经全部训练完毕,得到了权重数据,就无需再耗费时间,重新进行训练了。

也幸亏如此,否则就没办法及时把最终程序,提交到KAGGLE 官网上去了。

随后,江寒在最终版本的集成网络上,重新跑了一遍验证集。

结果十分喜人,识别准确率达到了惊人的99.62%。

这个成绩已经十分令人满意。

接下来,江寒就按照官网发布的说明,对自己的代码进行了一点处理。

主要是去掉一些调试语句,再将数据文件的接口,改成主办方要求的方式。

这样,官方在测试时,只需将测试用的数据文件,放入指定的文件夹里,而无需修改任何代码。

也许是对业余爱好者们的表现,并没有特别大的期待?

反正在这次比赛中,官方并没有要求公开源代码。

所以江寒也就没准备提供源代码。

他将自己的程序,用pyinstall编译成了可执行文件。

并使用了一点小技巧,将训练好的10个子网络的权重数据,也一起打包进了exe文件里。

最后,再用“初级数字混淆技术”加一道坚固的锁,这样就不怕被人逆向拆解了。

当然,江寒的这个集成学习方案,如果在比赛中一鸣惊人,等到比赛结束之后,说不定就会有大佬来联系他,询问设计思路之类的。

到时候,是否公开代码,用什么方式公开,公开到什么程度,江寒完全可以看情况决定。

也就是说,主动权完全掌握在自己手里。

晚上10多钟,抢在时间截止之前,江寒将加密后的EXE文件,连同相关的说明文档,一起上传到了KAGGLE官方的比赛服务器上。

好在今天晚上网络还算给力,没出什么幺蛾子,否则……

万一来个“非战之罪”,可就让人欲哭无泪了。

这件事到这里就暂告一段落,接下来,只需要安静地等着成绩发布。

第二天,江寒将夏雨菲送到学校后,自己也跟着下了车。

和老师和同学们阔别了差不多一个月,江寒终于决定回去上课了。

虽然可以拜托夏如虹再开一张诊断书,多续几天假,但他仔细考虑了一下之后,并没有那么做。

所有想要做的事情,都解决得差不多了,想写的论文也基本上写完了,没必要总是宅在家里。

江寒走进班级时,不少同学看到他,都感到很新奇,跑过来问东问西。

江寒看人下菜碟,时而正经,时而皮几句,总之应对自如。

李东、雷蕾等更加熟悉的人,反而没有第一时间围过来。

很简单,这一段时间里,大家时不时通个电话,该交流的早就交流过了。

江寒回到座位后,拿出了随身携带的《网络安全机密与解决方案》,埋头看了起来。

这本书被誉为“黑客圣经”,内容也的确很不错,但如果说只要学透了,就能成为十分强大的黑客,那无疑是有点想多了。

理论上来说,并没有任何一本书,能让人看完就成为优秀的黑客。

那些手段高明的黑客,往往都要掌握许多计算机软硬件知识,以及操作系统细节,谁了解得更多,理解得更深刻,谁的功力就更深一些。

黑客技术领域,能力的高低,往往体现在基本功上。

硬要说有什么秘籍的话,一些未公开的漏洞,以及个人发明的独特算法,勉强可以算得上吧。

但有法固有破,再神奇的技巧,只要当着其他高手的面儿,用上那么一次两次,基本上很快就会被破掉。

这个世界上,在加密技术领域,无法破解的技术并非没有,但绝对屈指可数。

要说其中最近最火的一个,那无疑非“坏苹果”莫属……

第一节下课,江寒上了趟洗手间。

回来之后,他就按照课表,拿出了语文书。

其实也未必有时间看,但不管怎么说,至少装装样子吧。

上课铃响后,一个最多也就24、5岁,气质相当优雅的女生,夹着教材、教案走了进来。

江寒一看不是易中海,就问李东:“她谁啊?”

“实习老师,姓郭,合师大中文系的。”

李东说着嘿嘿一笑,问:“好看吧?”

江寒:“……”

长得倒也不能说丑,但在他看来,只能算凑合。

长相能有7分,身材勉强5分,优点是够瘦,缺点是实在太瘦……

“实习老师……”江寒沉吟了一下,“所以,有了小助手,易老师就偷懒不来上课了?”

李东摇了摇头:“郭老师是前天才来的,易老师已经有半个月没上班了。”

“半个月?”江寒皱了皱眉。

自己一直没来上学,居然都不知道这件事。

第333章 不怕教坏了乖女儿?第58章 作报告?第118章 《如何高效判断数据是否线性可分》第97章 妈妈问我为何跪着看手机?第339章 翻云覆雨,点石成金第216章 有些事,再多的钱也没得谈第371章 莫非换了个女朋友?第163章 万能逼近定理第211章 就当帮他们改进一下服务质量了第160章 只能看到文章本身第157章 找个清静的地方第376章 很像一台成熟的计算机了第76章 还有什么是他不会的?第173章 磨刀不误砍柴工第11章 像我这么专一第408章 初入燕园第54章 专利第308章 敬可爱又无常的命运第322章 愚者注视着你第388章 组队刷分,在线卖软第85章 吊桥效应第295章 全世界没人教得了第271章 破坏永远比建设更容易第72章 玩不起第121章 还有谁会对自己这么好?第206章 整理论文第368章 能干的小秘书?第209章 校服就是最正式的装扮第67章 异或问题第78章 土豆和男朋友第251章 特效药第315章 故伎重施第421章 身世大白第251章 特效药第343章 差之毫厘,谬以千里第276章 丢1分和拿满分,哪个更难?第198章 唯实话与马屁不穿第228章 恐怖如斯第47章 都选C第136章 打造算术逻辑单元第244章 屋里陪他小电影?第310章 唯一的破绽第316章 顺藤摸瓜第57章 非常巨大第366章 微服私访?第8章 装〇也要讲基本法第394章 超参数全自动搜索第398章 商用级手写识别算法第336章 女孩的心思你别猜第349章 说错了什么?第48章 《如果时间能倒退》第226章 还能剩下几个?第301章 人间喜剧,喜闻乐见第10章 给老江打个电话第273章 假如氪金就能变强第353章 神乎其技第7章 所谓“取整”,就是……第209章 校服就是最正式的装扮第58章 作报告?第160章 只能看到文章本身第340章 实力还是运气?第83章 发卡第91章 这么忙吗?第1章 一夜回到十年前第219章 点到为止第187章 床下的小画册第264章 不知人间疾苦第6章 三个系统倒有四种资源?第254章 数据解析和FCN的拓扑结构第392章 深度卷积神经网络第28章 老宋的算盘第88章 有点刺激第303章 你以为就这样而已?第254章 数据解析和FCN的拓扑结构第263章 一切都在算计中第59章 上干货第318章 飞机点餐攻略第358章 27个学术点第123章 BT小鸟第219章 点到为止第86章 苏婉莹的预测第165章 看谁先怂第27章 买书偶遇第1章 一夜回到十年前第262章 贵有贵的道理第324章 如果是江寒哥哥的话……第407章 科幻片,恐怖片?第245章 什么事儿比NOIP还重要?第27章 买书偶遇第101章 偷换概念第387章 打印机和绘图仪第343章 差之毫厘,谬以千里第370章 四轴飞行器第367章 老板娘第75章 金少楼的警告第243章 比赛心得和骗分教程第117章 没听说过?第34章 游戏发布第103章 风口
第333章 不怕教坏了乖女儿?第58章 作报告?第118章 《如何高效判断数据是否线性可分》第97章 妈妈问我为何跪着看手机?第339章 翻云覆雨,点石成金第216章 有些事,再多的钱也没得谈第371章 莫非换了个女朋友?第163章 万能逼近定理第211章 就当帮他们改进一下服务质量了第160章 只能看到文章本身第157章 找个清静的地方第376章 很像一台成熟的计算机了第76章 还有什么是他不会的?第173章 磨刀不误砍柴工第11章 像我这么专一第408章 初入燕园第54章 专利第308章 敬可爱又无常的命运第322章 愚者注视着你第388章 组队刷分,在线卖软第85章 吊桥效应第295章 全世界没人教得了第271章 破坏永远比建设更容易第72章 玩不起第121章 还有谁会对自己这么好?第206章 整理论文第368章 能干的小秘书?第209章 校服就是最正式的装扮第67章 异或问题第78章 土豆和男朋友第251章 特效药第315章 故伎重施第421章 身世大白第251章 特效药第343章 差之毫厘,谬以千里第276章 丢1分和拿满分,哪个更难?第198章 唯实话与马屁不穿第228章 恐怖如斯第47章 都选C第136章 打造算术逻辑单元第244章 屋里陪他小电影?第310章 唯一的破绽第316章 顺藤摸瓜第57章 非常巨大第366章 微服私访?第8章 装〇也要讲基本法第394章 超参数全自动搜索第398章 商用级手写识别算法第336章 女孩的心思你别猜第349章 说错了什么?第48章 《如果时间能倒退》第226章 还能剩下几个?第301章 人间喜剧,喜闻乐见第10章 给老江打个电话第273章 假如氪金就能变强第353章 神乎其技第7章 所谓“取整”,就是……第209章 校服就是最正式的装扮第58章 作报告?第160章 只能看到文章本身第340章 实力还是运气?第83章 发卡第91章 这么忙吗?第1章 一夜回到十年前第219章 点到为止第187章 床下的小画册第264章 不知人间疾苦第6章 三个系统倒有四种资源?第254章 数据解析和FCN的拓扑结构第392章 深度卷积神经网络第28章 老宋的算盘第88章 有点刺激第303章 你以为就这样而已?第254章 数据解析和FCN的拓扑结构第263章 一切都在算计中第59章 上干货第318章 飞机点餐攻略第358章 27个学术点第123章 BT小鸟第219章 点到为止第86章 苏婉莹的预测第165章 看谁先怂第27章 买书偶遇第1章 一夜回到十年前第262章 贵有贵的道理第324章 如果是江寒哥哥的话……第407章 科幻片,恐怖片?第245章 什么事儿比NOIP还重要?第27章 买书偶遇第101章 偷换概念第387章 打印机和绘图仪第343章 差之毫厘,谬以千里第370章 四轴飞行器第367章 老板娘第75章 金少楼的警告第243章 比赛心得和骗分教程第117章 没听说过?第34章 游戏发布第103章 风口