机器学习比赛得了个银牌，感动

2019-08-30 01:51

Jonsoncao2019-08-30 01:51
Posted by Google Pixel 2 XL
用大数据的方法预测量子化学里面用Kohn-Sham模型算出来的原子偶联的能量，总共13万个分子700万个偶联的海量数据，每个偶联都能生成几千个特征

第一次得银牌，金牌的解法都牛逼的一塌糊涂…

感叹就是自己的显卡太烂…金牌基本都是几个1080Ti起跳，第一名更是卡内基梅隆大学机器学习的教授带了一个团队用Bosch的集群算的…

当然Kaggle自带的Tesla P100还是很牛的，我自己1060训练两天，放去云端4，5个小时就可以训练出一个几百万个参数的模型…

当然更感动的是自己上次参加比赛带的学生自己单干在没有任何我的提示下也得了个铜牌。
TGFC·NG
wingfay2019-08-30 01:52
前排蹭面子。
越狱的游客2019-08-30 01:53
高端仰望...
duxiaod2019-08-30 01:53
感觉好厉害的样子，恭喜恭喜～
Ander2019-08-30 01:54
machine learning 牛逼啊！
lizitaisha2019-08-30 01:54
这才是泥潭高端人士该干的事之一

一天天的只知道操比舔逼的真是让人发愁
真TMD是个粪青2019-08-30 01:55
看不懂，感觉很厉害的样子。
雾桑2019-08-30 01:56
我只知道，小老虎！牛逼！
lzj_freedom2019-08-30 01:56
牛x啊，完全不知所云，我落伍了
mike112019-08-30 01:57
牛逼。。。。。。。。。。。。。。。。。。。。。。。。。。真的
firesun2019-08-30 01:58
求解读，太高端实在是看不懂做了什么
cinder2019-08-30 01:58
曹总牛逼！
xuziyu20062019-08-30 01:59
牛逼
心之一方2019-08-30 02:00
小老虎厉害，不明觉厉
devil00000002019-08-30 02:01
好厉害
顺便问下用的什么算法
pigcfly2019-08-30 02:01
求分享解题思路，优化思路，kaggle拿到银牌不容易
农农2019-08-30 02:02
看不懂
跟风喊个牛逼
jfjfjfjf2019-08-30 02:03
不明觉厉。
ff512019-08-30 02:08
楼主牛逼，lowb码农刚开始玩机器学习，深感数学功底太差，学不动-_-|||
djkiller2019-08-30 02:09
不愧是泥潭唯一数学家
日曜の雨2019-08-30 02:09
牛逼牛逼高手
机器学习菜鸟路过
疾风之狼2019-08-30 02:10
牛的一匹
tensorflow深度学习菜鸟瞻仰大神
Jonsoncao2019-08-30 02:14
4个模型
1.万能GBM，用的当然是微软的lightGBM
2.简单的深度神经网络
3.两个基于图论的神经网络（把分子看成一个图，用顶点表示原子，边的state值表示偶联强度以及相关特征），第一个生成特征是用简单的message passing矩阵向量乘法，第二个是用了图卷积的Schnet

最后再用了一个简单的stacking。
ppigadvance2019-08-30 02:15
小老虎才是泥潭扛把子！
李元霸2019-08-30 02:15
不明觉厉。。。
beterhans2019-08-30 02:16
不明觉厉
疾风之狼2019-08-30 02:17
LZ怎么处理过拟合？
模型最后准确率多少？

[本帖最后由疾风之狼于 2019-8-30 14:23 编辑]
dragong2019-08-30 02:18
小老虎牛逼
惆怅的蚂蚁2019-08-30 02:19
一句话我都没看懂，就觉得牛逼
bjnintendo2019-08-30 02:19
能用来炒股么？
如何2019-08-30 02:20
看不懂，蹭面子。
Jonsoncao2019-08-30 02:24
可以的

今年早些我指导学生得了个小铜牌的洛斯阿拉莫斯国家实验室组织的预测地震的比赛，里面的技术完全可以转化到预测股票走势上

Recurrent神经网络，Attention网络，傅里叶变换后的Transformer网络，等等等等
食色和尚2019-08-30 02:32
厉害厉害！大学时学的什么卷积，矩阵向量什么的，全还给老师了！
至于楼主说的什么神经网络程序，从没写过程序的我只能仰望着看天书
深蓝色的海2019-08-30 02:38
一点都不懂，但知道一定很牛逼！
TG药丸2019-08-30 02:39
看不懂，还是舔逼去算了。。。
四轮驱动2019-08-30 02:48
终于有人发点高端的了
unicornck2019-08-30 02:51
腿囧牛逼！
m7812019-08-30 02:51
牛逼，不明觉厉！
lastwinner2019-08-30 02:52
联动之前人生高峰值的帖子不禁流下了泪水
Jonsoncao2019-08-30 03:01
实际上，最后所有模型都还是underfit（不知道中文是什么，欠拟合？）……因为数据量和特征量实在太多了……比如用球面调和函数生成的SOAP，一个原子就是接近1万个特征……两个原子组合起来……

这个比赛的并不是以准确率判定的，评分的标准是一个自定的标准，总共8种偶联（相邻到间隔了2个原子的氢-氢，氢-碳，氢-氮），每种偶联从4万左右的训练数据（相邻的氢-氮），到150万个训练数据（相隔两个原子的氢-碳）

每种偶联的误差绝对值平均之后取对数，然后在取这8个种类的log MAE的平均

最好的模型最后对相隔2个原子的氢-氢偶联，stacking过后5个fold的out-of-fold的预测值和真实值的绝对值误差平均是0.05几（相比第一名这个是0.02几已经达到量子模型的精度……）
abesun2019-08-30 03:02
Posted by: HUAWEI HMA-AL00
机器学习比赛，听起来像是在比赛编程，其实都是在拼数学算法。大学学习图像处理和模式识别的时候就已经明白了，我这块料不适合学编程，因为数学不突出。
毕业后只好找了个不需要数学的法律工作。
楼主很牛，赞一个。
Wbird2019-08-30 03:03
加州帝国觉胸虎真牛逼
疾风之狼2019-08-30 03:06
是欠拟合，LZ牛，再次瞻仰大神
lvcha2019-08-30 03:07
以后我有问题可以请教大佬吗
magtree2019-08-30 03:11
牛逼
傲笑乾坤2019-08-30 03:13
你坛各种藏龙卧虎
中途半端2019-08-30 03:13
泥潭真正的大佬
Snoozy2019-08-30 03:16
混泥潭真有面子
alexey2019-08-30 03:17
操版这才是人才+正能量，相形之下有钱有社会资源的某些人一肚子坑蒙拐骗的都是些什么玩意