看到很多人对ai入门有兴趣,我写一下我的体会吧【有浏览器就可以开搞】

  • l
    logic90
    我不是专家也不是大牛。。。我只是个菜鸟。。。希望能抛砖引玉,让大牛们多多分享

    首先,搞ai有两个路径,学术路径,产业路径。入门前要有自己的目标和定位。要想靠ai找工作,就要搞学术。要想把ai用在自己的项目中解决自己的实际问题或者只是想玩一玩实现一些自己的想法,要走产业路径。

    学术就不说了,跟入门关系不大,读论文写论文是个漫长的过程。这个过程对普通人非常的不友好,并不是说有多难,而且这个过程需要大量的时间和精力,只有全日制的学生能搞得定。

    后面重点讲产业化的入门。说产业其实也有点问题,现在ai的能力还不足以形成一个稳定的产业,不过大家都觉得未来可期。我理解产业化其实就是工程化,把一些论文里面高高在上的东西,变为普通工人可以操作的标准流程,从而大大降低门槛提高效率。

    说到入门,首先要说门槛。虽然现在工程化搞得已经不错,门槛已经非常的低,不过还是有门槛的。

    首先,一切的基础linux,建议学习ubuntu16.04,能不看攻略自己买个aws的ec2机器,登录并手动安装富强服务端并且能使用,这个水平就足够了。

    然后,深度学习的基础,离散数学。这东西看着很高大上,不过我们入门的话,能看懂符号,能懂矩阵的常用操作就可以了

    再然后,编程的基础,python。这个没什么可说的。

    最后,附加项,虽然入门用不上,但是也非常重要。英语,用来读最新的论文。c语言,生产版本的模型可能会需要c语言。

    上面的门槛觉得没问题的话,就可以继续了。既然我们要搞工程,首先要选个框架。框架有很多,注意入门的时候不要去纠结哪个好,随便拿一个开搞就是了,其实区别都不大的以后再换也就分分钟的事。这里我推荐百度的飞桨https://www.paddlepaddle.org.cn/还有谷歌的tensorflow(https://tensorflow.google.cn/这个是没有墙的),这两个框架的社区比较完善,对入门很友好,前者是中文社区,后者是英文社区。

    选好之后,就是准备开发环境了。既然是入门,那必须要简单粗暴开箱即用才好。这里我们可以直接用框架官方社区提供的免费实验环境,百度的是aistudio 谷歌的是colab,这两个都是免费的,浏览器打开直接去用就可以,aistudio提供的是免费的v100 gpu,colab提供的是免费的tpu或Tesla T4 GPU。至于怎么用,各家官网写的很清楚,去看就可以。同时,各家的实验环境也都提供了各种写好的代码供大家研究,直接拿过来改一改跑一跑就可以。

    环境也有了,下一步就是开搞了。我们既然是搞工程,自然是直接拿最新的研究成果来用啦。这里要特别说明一个词 sota (state-of-the art) 就是目前最先进的技术的意思。也就是说,我们搞事情的时候,直接拿sota的成果来开搞,总是没毛病的。推荐一个网站https://www.jiqizhixin.com/sota总结了各种任务的sota模型,直接挑一挑用就可以了。

    先写这么多吧。。。大家多交流,希望能有更多有意思的东西出现
    HiPDA·NG
  • 那时候
    找工作为什么要往学术路走?桂林旅游门票
  • l
    logic90
    因为工程实在是太简单了。。。培训班几个月就能搞定。。。所以除非有比较牛的项目,否则没人在意工程能力

    相反,论文是个硬指标,还是很难的。。。所以找工作会很有优势HiPDA·NG
  • y
    yxmr
    有空了在台机上搭一个玩玩
  • l
    logic90
    哈。。。一看你就没看完帖子。。。

    不需要搭环境,官方提供了免费的环境,有个浏览器就可以,开箱即用。。。还免费附带了目前业界主流配置的gpuHiPDA·NG
  • s
    suifeng123
    这是要从耕地播种开始搞牛肉面啊!有必要从硬件搭建、系统安装开始吗?有没有方便的线上平台呢?
  • l
    logic90
    呃。。。我写了啊。。。开箱即用。。。有个浏览器就可以搞目前最先进的模型
    HiPDA·NG
  • s
    suifeng123
    回复7#logic90


    还有个问题就是数据源,搞ai没数据源可不行啊,这个怎么解决呢?
  • s
    so_cool
    楼主说的就是线上平台吧?
  • s
    suifeng123
    回复9#so_cool

    是的,我没看仔细。。。。
  • l
    logic90
    呃。。。这个忘了说了。。。不过跟入门关系不大

    实际上。。。入门之后就会发现,以现在的ai的能力,数据不是什么大事HiPDA·NG
  • s
    skke
    最近在填鸭这方面,发觉自己基础好差,又开始学数学了,O(∩_∩)O,
  • g
    guoyongyi68
    mark不看系列
  • v
    viviaat
    实际尚对已工作的人来说,项目经验比论文重要太多
  • l
    logic90
    ai行业不是这样的。。。这行大家都没什么项目经验,都是从头开始。。。

    于是就只能拼学术能力了HiPDA·NG
  • s
    suifeng123
    这个不行吧。没有合适的数据源,就无法发现一些实际中会经常存在的问题,如数据清洗,参数分组,过拟合等问题。
  • E
    Enauvy
    除了离散数学一直想学没有学,其他条件基本都具备,看看能不能入门
  • l
    logic90
    关键词 预训练模型 公开数据集 基线版本,现在很少有从头开始搞的了。。。

    工程化很完善了,基础数据不需要自己搞,只需要关注自己业务相关的数据,需要的数据量小很多HiPDA·NG
  • s
    suifeng123
    恩。。。。用预训练模型是可以,但是一旦进入生产环境,会发现完全不是一回事。。。。 不过用这些数据做入门学习是够用了。
    其实要理解ai的原理并不是很难,但是其中的很多细节,需要比较好的数学基础才能体会了。
  • z
    zeroxia
    那你说的Ubuntu 16.04是做啥的?而且16.04也太老了吧。
  • h
    heron96
    马克。
  • l
    logic90
    这个版本框架和库支持的比较完善吧。。。18.04也是可以的,就是如果自己部署的话,可能更折腾

    就算用平台提供的notebook,实际上程序也是跑在linux上的,需要有这个基础才能用HiPDA·NG
  • l
    logic90
    哈。。。。那是当然,都要搞生产环境了,还舍不得投入资源搞点数据?HiPDA·NG
  • g
    gum_lee535
    关注一下
  • z
    zeroxia
    tensorflow不能在Windows里搞吗?

    如果一定要Ubuntu,在Docker里是不是性能不行?貌似都看不到显卡。
  • l
    logic90
    入门建议直接用官方提供的免费环境。。。没必要自己本地折腾部署。。。

    实际上,家用的gpu跟人家免费提供的gpu差距不是一点半点。。。 2080ti显卡才11g显存。。。在线平台提供的gpu都是16g显存起步的HiPDA·NG
  • v
    viviaat
    呃,很多公司内部大量的AI项目的,有兴趣可以去试试,前提是公司要大,因为AI基本不赚钱,还在花钱。
  • e
    everchens
    不需要离散数学,是线性代数
  • b
    bluebaby
    马克一下
  • n
    nokia3640
    这玩意到底有啥用?跟自控有啥区别?本人门外汉一个,呵呵。
  • l
    logic90
    其实,目前确实没啥用。。。
    但是,大家都觉得未来可期,马上就会有大用处
  • z
    znm
    那我貌似是搞工程的,第一次直接装了tesorflow 算法都不懂,gihub上下了个开源的跑分系统,然后把自己当数据集转换成开源里的格式上来就开跑,半天搞定,但是打分准确率80%不到,没法用,后来发现就是整个过程就是各种数据集调参数,再后来买了本书扫了下十大算法,算法根本美看懂,但是大概知道这些算法应用于哪些场景。

    感觉整个过程校区就是会用那套库,然后etl自己当数据集,剩下就是调整参数喝输入了 iOS fly ~
  • j
    jemws
    目前为止,有没有会自动思考的AI出现?或者只是很复杂的自动化处理?
  • l
    logic90
    看你怎么定义自动思考,怎么定义复杂自动化处理。。。

    会下围棋算不算自动思考?会做阅读理解算不算自动思考?会命题作文算不算自动思考?HiPDA·NG
  • j
    jemws
    回复35#logic90


    有道理。这些都已经实现了。会不会编程
  • l
    logic90
    哈。。。这个有难度。。。不过也算个热门方向

    前段时间不就有吗,有个号称ai编程的平台,搞了一大波投资。。。后来发现是把编程外包给印度人了

    HiPDA·NG
  • f
    fhw373021370
    在线学习啊
  • k
    koalar
    与时俱进,了解个大概挺好
  • h
    hookgao
    Mark下, AI 入门 iOS fly ~
  • s
    sunever999
    马克一下,应该会很好玩 iOS fly ~
  • i
    ipadmini
    学习交流
  • l
    logic90
    其实还是挺枯燥的。。。大部分时间都是在折腾数据,真正关键的模型的代码没几行,非常的简单粗暴

    而且目前ai的能力离大规模应用还有一定的距离HiPDA·NG
  • y
    ynr
    学习一下,也入个门
  • s
    skottie
    马克一下,好贴
  • s
    swimking
    我也很感兴趣唉,不过我觉得前景并不广阔,我对ai的发展持悲观态度,但是不妨碍水论文搞项目。
  • 咸鱼翻身
    马克一下
  • v
    veblen
    其实不太推荐这些开箱即用作为入门的东西。
    要入门的话,说明你没有基础,没有基础只能一步一步从基础学起,其实网上这样的教程还是很多的。
    如果似懂非懂直接上模型开搞,就像初中的函数还没有学习,就直接开始抄大学高数的微积分解题过程。能抄对,看起很牛逼,但是其实你什么也不会。
    如果从事这个行业,两个方向,一个工程方面搞性能和引擎什么的。二是算法方面,会调参。拿着自家的数据上模型,准确度不高或其它的问题,知道怎么改进。如果还直接改进模型本身,就基本进入一线大牛的行列了。
  • l
    logic90
    我说的是入门。。。开箱即用都能劝退很多人了。。。你再搞从基础入门。。。

    估计人都跑光了HiPDA·NG
  • j
    jckimi
    回复14#viviaat


    错了,我们台北AI招人,实际经验只占10%,学术能力占70%