深度学习 - OCR,人脸等

  • s
    sswjzx
    感谢,我复现一下,anchor free。
    我也分享一下一点浅显的东西
    我做实时性的detection比较多,yolov2+kcf在嵌入式端表现比较不错
    二分类语义分割的话,mobilenetv2做encoder的unet在训练时间和结果上不错,dice loss也有提升。
    做实时性图片分类的话,魔改mobilenetv2,用grad-cam做可视化分析,鲁棒性可以做到不错 iOS fly ~
  • m
    mkkmkk
    很厉害,最近也在入门学习。之前简单入门做过漫画分割,论坛也发过帖子。想问问,ML这块更新很快,LZ一般上哪些网站看不同领域最近发展情况和有什么出彩的论文?arXiv当然是必须的哈哈。 mkkmkk
  • s
    smartjx
    请教下楼主,做试卷识别应该怎么做。能提供下思路吗。
  • l
    lishuanzhu
    再更新下
  • l
    lishuanzhu
    回复53#smartjx


    算法就是我说的那些算法,关键是后面的工程以及数据
  • d
    davidchiu
    是牛人不错,支持一下。
  • k
    kaidokido
    不给力 搞个群
  • a
    alvise
    技术含量高的帖子mark
  • j
    jfeshoji
    用的tensorflow还是pytorch啊?
  • 我好像是小号
    回复55#lishuanzhu
    OpenCV的灰度匹配有优化空间嘛?iOS fly ~
  • h
    hanbing135
    本论坛没几个人能看懂吧
  • F
    FQX
    回复1#lishuanzhu
    你进步好快啊。
    我的机器学习白学了,金融机构根本不用。
    tf 2.0的代码应该跟python的哲学比较接近了。
    我觉得还是跟着Google走不会错。 iOS fly ~
  • f
    felonwan
    学习了。已出坑tensorflow,转到pytorch。
  • u
    usdfb
    厉害的
  • w
    wrs
    关注~~~
  • h
    hookgao
    mark 智能识别 iOS fly ~
  • p
    petter220
    大牛的帖子要Mark一下学习人工智能
  • s
    shooirn
    路过学习。
  • g
    galaxyhere
    马克,图像识别
  • x
    xvzan
    到底是哪个傻冒把field翻译成野的
  • w
    wenhairong
    学习了…。 iOS fly ~
  • c
    cookbook
    很厉害,大牛 iOS fly ~
  • h
    helio2k
    佩服,学习了。 iOS fly ~
  • h
    hjkl0001
    谢谢分享 iOS fly ~
  • 盛世美颜
    厉害 学习下
  • r
    richey07
    mark iOS fly ~
  • C
    CrossAge
    Mark 有兴趣
  • c
    cnkiller
    楼主牛🍺,都申请到专利了
  • f
    fy883
    好贴 马克,以为还是实验性的原来已经实用了啊。检测PS防诈骗思路确实好。
  • w
    w7a8
    深度学习,努力学习
  • l
    lishuanzhu
    回复60#我好像是小号


    传统的图像算法都是有假设前提的,工程上肯定有优化空间,不过个人感觉会很费事。
  • l
    lishuanzhu
    回复62#FQX


    看你如何定义问题了,我现在做的各种东西都是金融AI的应用,票据识别,前置反欺诈等等;起码在东南亚这种基础设施比较落后的地方还是有很大的需求的
  • m
    mozhenliang
    如果将下图中的资料,如何识别成结构化的资料,例如变成excel文件?


    我用腾讯api接口,给出来的数据,都是一行一行文件,根本不能使用

  • g
    godzillaqqq
    google的验证码平台就是大型人肉orc
  • F
    FQX
    回复83#lishuanzhu
    国内的持牌金融机构不用的。
    你是在互联网金融行业吗? iOS fly ~
  • r
    richking
    牛笔学习了
  • e
    etoad
    mark学习 iOS fly ~
  • l
    lishuanzhu
    回复86#FQX


    不是,创业,做东南亚市场
  • m
    mkkmkk
    票据识别lz能说说大致思路吗? mkkmkk
  • l
    lishuanzhu
    回复84#mozhenliang


    这个属于后处理范畴,识别完成后,需要对信息进行提取。这个暂时都是定制化的。
    表格识别,需要有专门的分割模型去做,然后再一一对应填充,再转换为专门的excel格式

    table.jpg
  • z
    zinwa.lin
    太牛了。。
  • g
    godzillaqqq
    .......唉,被人忽悠搞Deepfakes矿卡都还没拆
  • w
    whatfun
    mark~~~
  • n
    nglee
    回复83#lishuanzhu
    lz难道是第四范式或者一览群智这样的创业公司么?看上去做的很深入 iOS fly ~
  • t
    toshg
    大牛,图片对比有啥好用的API吗?我们要对比大量的商标图样,文字图形都有可能,找出重复。
  • l
    lishuanzhu
    回复97#toshg


    我第一反应是网上爬上几十万个商标,每个商标有十几张,随便找个resnet什么的跑个分类模型,然后抽取图像embedding特征,后面用faiss或者annoy搭建一个搜索引擎跑就行了
    通用API应该是没有的
  • l
    lishuanzhu
    回复96#nglee


    不是,小公司,目前只拿了天使轮
  • y
    yishuqq1
    麻烦推荐一些相关的书籍让我等小白入下门