返回目录
关灯 护眼
加入书架

我的金融科技帝国 第656章

(ps:切掉的新书已更新过章节内容不可能放这本,没那么丧心病狂,只是搜索引擎名字引用了「灵境搜索」,因为想了几个名字都觉得没这个合适,现在人工智能和gpt那么热,正好2013年是生物识别技术和神经网络开始爆发的年头,本来ai的剧情就是从本书大纲挪过去,不在本书展开,新书嘎了,那边也还没展开,所以调整回来,但已经更新了的章节内容是绝对不会发第二次。

——

陈宇说到这里顺手关掉了会议大屏幕的ppt,转而看向众人说:「ai语言大模型的建构,后面的一大工作重点就是数据投喂,底层算法架构虽然不是基于自然语言处理nlp,但毫无疑问也受其影响,接下来的数据投喂首先是把互联网上已有的公开数据截止2012年之前产生的存量数据信息都给我爬一遍,国内国外的都要爬。」

这等于是白嫖全人类千百年来所积累的绝大部分知识。

一位与会的工程师询问道:「每天大约要爬取多少数据量?」

陈宇言简意赅:「5个pb左右。」

5个pb?

众人都是一阵惊愕,5个pb的数据量换算一下就是500多万gb的数据量,互联网巨头谷歌在2008年每天处理的数据量大约是20个pb左右,相当于是其四分之一的数据处理量。

这是一项大工程,而且超级消耗算力资源,换句话说就是烧钱啊,光是网费就要一大笔开支。