第237章 深度学习的开始
,我始终觉得,百度是最有技术基因的中国互联网企业,13年的时候他在干嘛?移动互联网的上半场转型失败了的百度,正布局移动应用分发,收购91;布局o2o,做平台卖外卖;布局互联网金融,做支付工具呢。
什么都做,什么都不突出,是百度那时候新项目的真实写照。至于人工智能,那可就是2016的事了。
要说对人工智能的理解,重生归来的莫浩波,肯定是比所有人都要强的,可是现在弄不出什么牛逼的东西出来。
无他,硬件不够,莫浩波大哭。8g内存,1个gpu,够干啥,n和图片识别、计算机视觉是不用想了,这条件,也构建不出啥深度模型。
语音识别比较简单,莫浩波也不熟,就不去凑热闹了。那就只有自然语言处理了!文本也比较适合他现在的情况,虽然即便是18年,自然语言处理技术也不咋地,和牛逼哄哄的图片识别相比,那是一个天上一个地下的水平啊。
不过,必须要说,聪明的研究人员,也做出了很多了不起的成绩。
莫浩波要抄的,就是13年10月投稿的词向量word2vec改进——负采样技术。
word2vec,那在自然语言领域可是无人不知无人不晓啊。可以说,它是深度学习领域自然语言处理的核心基本构建了。
将文本信息,比如说一句话“明天天气怎么样?”,转化为计算机能够识别的信息,那就是要转化为数学啊。
用one—hot方法,虽然简单但是效果并不太好,因为这样做的话,就丢失了很多语句中隐藏的信息。
而word2vec是一种能够保留局部上下文信息的方法…………
。
什么都做,什么都不突出,是百度那时候新项目的真实写照。至于人工智能,那可就是2016的事了。
要说对人工智能的理解,重生归来的莫浩波,肯定是比所有人都要强的,可是现在弄不出什么牛逼的东西出来。
无他,硬件不够,莫浩波大哭。8g内存,1个gpu,够干啥,n和图片识别、计算机视觉是不用想了,这条件,也构建不出啥深度模型。
语音识别比较简单,莫浩波也不熟,就不去凑热闹了。那就只有自然语言处理了!文本也比较适合他现在的情况,虽然即便是18年,自然语言处理技术也不咋地,和牛逼哄哄的图片识别相比,那是一个天上一个地下的水平啊。
不过,必须要说,聪明的研究人员,也做出了很多了不起的成绩。
莫浩波要抄的,就是13年10月投稿的词向量word2vec改进——负采样技术。
word2vec,那在自然语言领域可是无人不知无人不晓啊。可以说,它是深度学习领域自然语言处理的核心基本构建了。
将文本信息,比如说一句话“明天天气怎么样?”,转化为计算机能够识别的信息,那就是要转化为数学啊。
用one—hot方法,虽然简单但是效果并不太好,因为这样做的话,就丢失了很多语句中隐藏的信息。
而word2vec是一种能够保留局部上下文信息的方法…………
。