努努书坊

繁体版 简体版
努努书坊 > 年近三十,科技立业 > 第75章 怎么感觉都不是一个时代的产物啊你这!(求月票)

第75章 怎么感觉都不是一个时代的产物啊你这!(求月票)(2 / 5)

【第一步,数据准备……】

【第二步,训练分词器,分词就是把去除特殊字符、标点符号等要去掉,然后进行分词,词干提取等,把输入文本切分成有意义的子单元,这样模型才能更好地理解和学习文本数据。】

【第三步,安装配置环境……】

……

在b站,夏飞同学的名气并不打算大,但此刻,一个一个的人正在不断的涌入,看他怎么从0训练一个简易gpt模型。

一大票人在那看的津津有味儿,实际他们什么都没看懂,尤其是代码部分,那更是看的云里雾里。

那他们看什么呢——直播画面中的画中画——画中画的内容赫然就是正是纪弘紧急训练成长引航模型的场景。

“小飞啊,伱看看人家,那一开口:‘资料拿来,复制导入,好,完了齐活。开始训练。’

“你这这是在这干啥呢?还分词,分的那是什么玩意儿?不就金庸的几本吗?15本是吧,全加起来也就几十兆吧?吭哧吭哧半天了都我在这看你,怎么还没完呢?怎么感觉都不是一个时代的产物啊你这!”

跟想象中优雅从容的场景不同,与纪弘训练ai的场景更是完全迥异,夏飞同学手忙脚乱的场景更是遭到了质疑:

“你就是这么训练ai的?不是糊弄我们吧?”

夏飞同学笑了笑:“这才是正常的,不正常的是卷耳智能科技。我这么告诉你吧,不管是微软还是openai,不管是百度还是阿里,不管是通义千问还是文心一言,所有的ai训练都是我这个流程。

“只是规模大或者规模小而已,模式、步骤、甚至代码都是一样的,因为用的都是开源的gpt代码,巨头公司可能有自己的迭代,但是总体是差不多的。”

观众顿时又有些懵,你们原来是这么玩儿的啊,怪不得这么落后,比不上卷耳智能科技,这

『加入书签,方便阅读』