穿越从犬夜叉开始_第237章深度学习的开始-笔趣阁

第237章深度学习的开始

，我始终觉得，百度是最有技术基因的中国互联网企业，13年的时候他在干嘛？移动互联网的上半场转型失败了的百度，正布局移动应用分发，收购91；布局o2o，做平台卖外卖；布局互联网金融，做支付工具呢。

什么都做，什么都不突出，是百度那时候新项目的真实写照。至于人工智能，那可就是2016的事了。

要说对人工智能的理解，重生归来的莫浩波，肯定是比所有人都要强的，可是现在弄不出什么牛逼的东西出来。

无他，硬件不够，莫浩波大哭。8g内存，1个gpu，够干啥，n和图片识别、计算机视觉是不用想了，这条件，也构建不出啥深度模型。

语音识别比较简单，莫浩波也不熟，就不去凑热闹了。那就只有自然语言处理了！文本也比较适合他现在的情况，虽然即便是18年，自然语言处理技术也不咋地，和牛逼哄哄的图片识别相比，那是一个天上一个地下的水平啊。

不过，必须要说，聪明的研究人员，也做出了很多了不起的成绩。

莫浩波要抄的，就是13年10月投稿的词向量word2vec改进——负采样技术。

word2vec，那在自然语言领域可是无人不知无人不晓啊。可以说，它是深度学习领域自然语言处理的核心基本构建了。

将文本信息，比如说一句话“明天天气怎么样？”，转化为计算机能够识别的信息，那就是要转化为数学啊。

用one—hot方法，虽然简单但是效果并不太好，因为这样做的话，就丢失了很多语句中隐藏的信息。

而word2vec是一种能够保留局部上下文信息的方法…………

。