第210章 联合登月前(求月票!) (2/6)
本站域名 【m.64sw.com
如果遇到没有章节内容的情况,请尝试换个浏览器阅读
换源:
节点二二 ↓

进同一个池子,也会有各种各样的担心。

    因为你很难保证,所有研究机构提供的数据不会污染数据库。

    有人数据造假,就会污染整个数据源。

    目前就我了解到的情况,类似研究数据非常稀缺,最多的数据也要少于4000个样本。

    特征工程是AI模型成功的关键,但其设计在材料属性预测中尤为复杂。

    物理元素性质,像原子量、电负性这些和材料结构,像晶格类型、键长这些,都要转化为数值特征,提供给模型学习。

    其中特征选择直接影响模型准确性,错误选择可能导致性能下降。

    目前整个过程仍然需要依赖研究人员去手动处理特征值,去做筛查。

    非常依赖研究者经验和直觉,极可能遗漏重要信息。

    nature去年的子刊他们整出了一个MODNet的学习框架,就是一个材料属性预测的机器学习框架。

    (《通过特征选择和MODNet的联合学习实现有限数据集的材料属性预测》于2021年6月3日刊登在Nature子刊NPJ上)

    他们发现要预测材料的振动熵时,反向键长和p价电子是关键特征,但手动识别这些特征需深厚领域知识。

    这些数据的提取需要有足够丰富经验的科研民工来做,同时还要确保数据的精确,降低误差,整个过程非常繁琐。

    因为我们要做的东西远比他们更复杂,我们要做的是一个更大的,更复杂的模型,特征数据的归纳总结和收集,速度肯定很慢。

    毕竟这件事无法像网络空间的数据那样,可以通过特征值剔除,各种办法来确保数据的准确,它的数据用计算机术语来说,从外表看上去是结构化数据,但内核却非常的不结构化。

    因此按照我的估计,至少前五年,前五年华为的计算卡都够用。

    至于五年之后,华为的计算卡也会与时俱进,加上我们本身也会和华为合作来推进他们计算卡的进度。”

    Pony听完后大致能够理清思路,不说完全听懂,毕竟你想让一个五十岁的人听懂振动熵、反向键长和p价电子这些东西,那还是太为难Pony了。

    但林燃要表达的点,他都理解了。

    Pony说道:“林生,我没有反对和华为合作的意思,同样的,我们面临的形势我很清楚,固然有寒武纪、阿里、百度这些厂商都有自己的计算卡,但一方面他们的计算卡代工需要依赖台积电,另外一方面在生态上,华为走的最远,从长期来看,他们在长期构建生态这件事上有着最大的决心和能力。

    我只是感慨,我们当前面临的局面困难。

    林生,我有一个问题,我们是不是应该和一些高校的化学系、物理系之类的搞横向课题?让他们来帮我们完善我们的数据池?”

    此时市面上不止华为有计算卡,Pony提到的哪几家都有在推,但计算卡这玩意不仅仅是看硬件,和硬件配套的软件生态也同样重要。

    英伟达为什么如此强势,AMD不也有在造AI芯片吗?为什么都是阿美利肯企业,AMD的计算卡威胁不了英伟达?英伟达的护城河在于它常年培养起来围绕着计算卡名为CUDA的生态。

    同样,华为有建鸿蒙的决心,在计算卡这个领域

本章未完,请点击下一页继续阅读

科技入侵现代最新章节 http://m.64sw.com/xiaoshuo/kejiruqinxiandai/read/97/462.html !64书屋,有求必应!