由于时差的关系,林灰睡熟的时候,地球另一边的人们还在紧张忙碌的工作中。
加利福尼亚时间比BJ时间慢16个小时,此时刚刚是21号上午8点。
斯坦福大学(位于加利福尼亚)校园内研究室还有一个自然语言处理算法团队正在忙碌着。
看到这个研究室内忙碌的一众研究人员,不少斯坦福大学经过的计算机专业相关的学生都会不自觉地将脚步放轻。
将脚步放轻的同时,这些人还会对研究室内的人员产生一丝羡慕。
因为他们知道虽然这些研究人员是在斯坦福大学的研究室内做着研究。
但实际上研究室中大部分成员都不属于斯坦福大学,而是属于大名鼎鼎的谷/歌研究院。
而谷/歌研究院可以说是所有斯坦福致力于就业的计算机专业相关的学生梦寐以求的工作场所了。
尽管这个地方的工资只能说是中等偏上吧,但关键是酷啊。
多少改变世界的技术都是从谷/歌研究院诞生的,
而哪个学子不曾幻想过改变世界呢?
总之这些路过学子眼中流露出的神采多数都是羡慕,以及一丝丝嫉妒。
埃克来尔·基尔卡加博士就是研究室中的一员,他可不觉得他现在的生活哪里值得羡慕。
拿着$325000的年薪,却要过着蝼蚁一般的生活。
虽然现在才是早上八点,但事实上他和他的伙伴们已经忙碌了几乎一整晚了。
埃克来尔·基尔卡加讨厌这种忙碌!
但是却又不得不忙碌!
如果他们这个文本处理算法开发团队不及时跟进最新的生成式文本摘要相关技术。
那么他们极有可能步麻省理工学院自然语言处理文本摘要小组的后尘:
——走向分崩离析。
虽然他们作为谷/歌研究院的一部分不大可能被直接遣散。
但很有可能被派遣到阿三那边的研究院。
听说那边的谷/歌研究院才刚刚成立,现在很缺人手。
埃克来尔·基尔卡加可不想去那个肮脏混乱的土地。
一想到可能到来的悲惨结局,埃克来尔·基尔卡加讨厌那个叫LIN HUI的家伙。
这么一个算法鬼才,搞什么算法不都会有所成就?
干嘛非要搞什么生成式文本摘要算法来抢他们的饭碗?
埃克来尔·基尔卡加正发着牢骚呢,突然听到了同组人员哈雷·普来斯的呼喊:
“嘿,埃克来尔·基尔卡加别发呆了,你那边测试结果怎么样?”
埃克来尔·基尔卡加:“别提了,简直糟糕透顶,我们所采用的X1算法在各方面的参数上都比不上林在南风APP里所采用的算法……”
所谓的X1算法是埃克来尔·基尔卡加他们团队受LIN HUI申请的专利中公开的技术路线启发,开发的一个生成式摘要实验算法。
之所以称为实验算法,是因为该算法主要用于测试。
作为一个测试算法,X1算法是合格的。
埃克来尔·基尔卡加他们搞得这个算法已经有点生成式摘要算法那味了。
然而这个算法现在也仅仅只能作为测试算法了。
离真正的距离实际应用却还差一步,然而尽管看起来只是一步。
这一步之遥,却可谓是天差地别。
客观地说,X1算法无论是文本摘要抽取速度还是准确度和LIN HUI南风APP里面的算法都差得远。
提到准确度,埃克来尔·基尔卡加就郁闷。
连衡量准确度的标准都是LIN HUI提供的,拿什么去跟人家竞争?
还没开始就已经结束了。
而且最令人郁闷的是他们搞得这个X1算法别说是跟LIN HUI搞得算法比了。
就是和他们之前鼓捣的算法相比,在抽取速度和准确度方面也是各种被吊打。
这种情况不免让埃克来尔·基尔卡加有些悲观。
哈雷·普来斯:“说说具体数值上的差距。”
埃克来尔·基尔卡加:“我感觉你不会想知道的,具体差距令人绝望。
结果打印出来了,你拿去自己看吧……”
哈雷·普来斯接过埃克来尔·基尔卡加递过来的报告,翻看了不一会便皱起了眉:
“在识别准确度上有差别我能理解,毕竟LIN HUI搞得那套算法肯定是经过很长时间训练才得到的结果。
可是为什么我们搞得这个X1算法在识别速度上比南风APP里的算法要慢很多呢?
正常来说两个理论相同的算法在处理同一问题时候,算法时间复杂度不都应该是一样的吗?”
埃克来尔·基尔卡加:“谁知道呢?可能我们采用的机制有问题……”
哈雷·普来斯:“怎么可能,LIN HUI阐述的技术路线不就是以序列到序列(Sequeo-Sequence)深度神经网络模型为基础么?如果他的技术路线有问题的话我们完全可以去控告他的专利无效?”
埃克来尔·基尔卡加:“别天真了!他只是说模型是以Sequeo-Sequence模型为基础,又没说他在算法里现在还应用这个模型的早期版本。”
哈雷·普来斯:“这些该死的异乡人,真是卑鄙……”
埃克来尔·基尔卡加:“别抱怨了,换作我们遇到同样的问题,使用的手段可能会更加过分。而且现在的重点是提升算法处理的准确度,至于速度什么其实不重要……大不了到时候我们可以将这个算法放在分布式系统上运行。”
在计算机科学中,分布式计算,又译为分散式运算。
分布式系统是一组电脑,透过网络相互连接传递消息与通信后并协调它们的行为而形成的系统。
哈雷·普来斯知道,谷/歌近些年因为谷/歌大脑计划在分布式计算上进步很大。
要是将这个算法放在分布式系统上确实可以在执行速度上有所突破。
得知此消息,但哈雷·普来斯丝毫高兴不起来。
一旦真的选择了将算法放在分布式系统上运行,那就等于他们直接落败了。
要知道南风APP里的算法可是离线运行的,甚至连服务器都没有。
直接上分布式算法,跟杀鸡用h弹有啥区别。
而且速度上同LIN HUI算法的差距还算在哈雷·普来斯理解范畴之内。
准确度上同LIN HUI算法的差距才是真真正正地大到让人绝望。
在哈雷·普来斯他们搞得X1算法准确度上甚至都比不上连尼克那个蠢猪弄得雅虎新闻摘要里采用的算法的摘要准确度。
这让哈雷·普来斯很是郁闷。
……
过了一会,哈雷·普来斯突然灵光一现,对埃克来尔·基尔卡加喊道:
“亲爱的伙计,你说问题会不会是出在LIN HUI搞得那个准确度衡量标准上。
应用那个准确度衡量标准的话,只有LIN HUI自己的算法用那个衡量标准才会获得高分……”
埃克来尔·基尔卡加:。
。
埃克来尔·基尔卡加:“或许你的想法有你的依据,但是我现在更建议你去睡觉……你可能有点恍忽了,究竟是什么原因让你觉得一个标准委员会审核过的标准会是一个不公平的标准呢?”
哈雷·普来斯:“因为那个LIN HUI是c国人,他们什么手段都会干,我记得他们国家有的手机厂商为了宣称自己的手机强大还会专门开发一个测试软件,使用那个测试软件只有他们自己的厂商搞得手机才能获得高分。
照我看来,那个LIN HUI搞得那个衡量标准度的模型就是类似于这样一款测试软件……”