机器学习比赛得了个银牌,感动

  • J
    Jonsoncao
    Posted by Google Pixel 2 XL
    用大数据的方法预测量子化学里面用Kohn-Sham模型算出来的原子偶联的能量,总共13万个分子700万个偶联的海量数据,每个偶联都能生成几千个特征

    第一次得银牌,金牌的解法都牛逼的一塌糊涂…

    感叹就是自己的显卡太烂…金牌基本都是几个1080Ti起跳,第一名更是卡内基梅隆大学机器学习的教授带了一个团队用Bosch的集群算的…

    当然Kaggle自带的Tesla P100还是很牛的,我自己1060训练两天,放去云端4,5个小时就可以训练出一个几百万个参数的模型…

    当然更感动的是自己上次参加比赛带的学生自己单干在没有任何我的提示下也得了个铜牌。
    TGFC·NG
  • w
    wingfay
    前排蹭面子。
  • 越狱的游客
    高端仰望...
  • d
    duxiaod
    感觉好厉害的样子,恭喜恭喜~
  • A
    Ander
    machine learning 牛逼啊!
  • l
    lizitaisha
    这才是泥潭高端人士该干的事之一

    一天天的只知道操比 舔逼的真是让人发愁
  • 真TMD是个粪青
    看不懂,感觉很厉害的样子。
  • 雾桑
    我只知道,小老虎!牛逼!
  • l
    lzj_freedom
    牛x啊,完全不知所云,我落伍了
  • m
    mike11
    牛逼。。。。。。。。。。。。。。。。。。。。。。。。。。真的
  • f
    firesun
    求解读,太高端实在是看不懂做了什么
  • c
    cinder
    曹总牛逼!
  • x
    xuziyu2006
    牛逼
  • 心之一方
    小老虎厉害,不明觉厉
  • d
    devil0000000
    好厉害
    顺便问下用的什么算法
  • p
    pigcfly
    求分享解题思路,优化思路,kaggle拿到银牌不容易
  • 农农
    看不懂
    跟风喊个牛逼
  • j
    jfjfjfjf
    不明觉厉。
  • f
    ff51
    楼主牛逼,lowb码农刚开始玩机器学习,深感数学功底太差,学不动-_-|||
  • d
    djkiller
    不愧是泥潭唯一数学家
  • 日曜の雨
    牛逼牛逼高手
    机器学习菜鸟路过
  • 疾风之狼
    牛的一匹
    tensorflow深度学习菜鸟瞻仰大神
  • J
    Jonsoncao
    4个模型
    1.万能GBM,用的当然是微软的lightGBM
    2.简单的深度神经网络
    3.两个基于图论的神经网络(把分子看成一个图,用顶点表示原子,边的state值表示偶联强度以及相关特征),第一个生成特征是用简单的message passing矩阵向量乘法,第二个是用了图卷积的Schnet

    最后再用了一个简单的stacking。
  • p
    ppigadvance
    小老虎才是泥潭扛把子!
  • 李元霸
    不明觉厉。。。
  • b
    beterhans
    不明觉厉
  • 疾风之狼
    LZ怎么处理过拟合?
    模型最后准确率多少?

    [本帖最后由 疾风之狼 于 2019-8-30 14:23 编辑]
  • d
    dragong
    小老虎牛逼
  • 惆怅的蚂蚁
    一句话我都没看懂,就觉得牛逼
  • b
    bjnintendo
    能用来炒股么?
  • 如何
    看不懂,蹭面子。
  • J
    Jonsoncao
    可以的

    今年早些我指导学生得了个小铜牌的洛斯阿拉莫斯国家实验室组织的预测地震的比赛,里面的技术完全可以转化到预测股票走势上

    Recurrent神经网络,Attention网络,傅里叶变换后的Transformer网络,等等等等
  • 食色和尚
    厉害厉害!大学时学的什么卷积,矩阵向量什么的,全还给老师了!
    至于楼主说的什么神经网络程序,从没写过程序的我只能仰望着看天书
  • 深蓝色的海
    一点都不懂,但知道一定很牛逼!
  • T
    TG药丸
    看不懂,还是舔逼去算了。。。
  • 四轮驱动
    终于有人发点高端的了
  • u
    unicornck
    腿囧牛逼!
  • m
    m781
    牛逼,不明觉厉!
  • l
    lastwinner
    联动之前人生高峰值的帖子 不禁流下了泪水
  • J
    Jonsoncao
    实际上,最后所有模型都还是underfit(不知道中文是什么,欠拟合?)……因为数据量和特征量实在太多了……比如用球面调和函数生成的SOAP,一个原子就是接近1万个特征……两个原子组合起来……

    这个比赛的并不是以准确率判定的,评分的标准是一个自定的标准,总共8种偶联(相邻到间隔了2个原子的氢-氢,氢-碳,氢-氮),每种偶联从4万左右的训练数据(相邻的氢-氮),到150万个训练数据(相隔两个原子的氢-碳)

    每种偶联的误差绝对值平均之后取对数,然后在取这8个种类的log MAE的平均

    最好的模型最后对相隔2个原子的氢-氢偶联,stacking过后5个fold的out-of-fold的预测值和真实值的绝对值误差平均是0.05几(相比第一名这个是0.02几已经达到量子模型的精度……)
  • a
    abesun
    Posted by: HUAWEI HMA-AL00
    机器学习比赛,听起来像是在比赛编程,其实都是在拼数学算法。大学学习图像处理和模式识别的时候就已经明白了,我这块料不适合学编程,因为数学不突出。
    毕业后只好找了个不需要数学的法律工作。
    楼主很牛,赞一个。
  • W
    Wbird
    加州帝国觉胸虎 真牛逼
  • 疾风之狼
    是欠拟合,LZ牛,再次瞻仰大神
  • l
    lvcha
    以后我有问题可以请教大佬吗
  • m
    magtree
    牛逼
  • 傲笑乾坤
    你坛各种藏龙卧虎
  • 中途半端
    泥潭真正的大佬
  • S
    Snoozy
    混泥潭真有面子
  • a
    alexey
    操版这才是人才+正能量,相形之下有钱有社会资源的某些人一肚子坑蒙拐骗的都是些什么玩意