幻想有简单的方案只是因为没亲手做过:虚拟女友计划104
- nancyivy我,一个低水平程序员,以前曾在TGFC发过许多贴来进行编程学习。现在,在看过GATEBOX之后,打算开始自制虚拟女友机器人。(他们没给我广告费)
我的现状就是从来没碰过硬件,单片机,树莓派,摸都没摸过;只会软件编程,水平很低,略懂3D建模,水平超低。
我打算做的成品,虚拟女友,在我一个低水平程序员的设想中,由以下几部分组成:
1.实体。全息投影。
2.外貌设定。3D模型建模。
3.灵魂。能进行最简单的语音交互。我对她说HELLO,她要能对我说HELLO。因此,这里必须涉及语音输入和输出。语音识别有简单的解决方案,也有超复杂我基本不能做到的解决方案。
好了,现在我什么都不会。从第一步开始全是我没做过的东西。我打算记录我学习,犯错,进步,制作的全过程(计划拍成视频),一步一步全部记录下来,力求其他人看了我的过程后如果想要做,能照着做,一直到我卡在某处无法前进为止。
虚拟女友计划101--------------------------------------------------------------------
第一步,经过我的搜索,全息投影解决方案有各种各样的。
如果你在国内,打开淘宝,搜索“DIY全息投影”,“手机全息投影”,“3D全息投影”之类,即可找到便宜大碗的产品,需要注意的是,其实这个就是塑料片,如果哪位DIY高手自己能用塑料片做,其实根本都可以不用买。
如果你在美国,打开亚马逊,搜索“hologram”,可以找到比淘宝贵得多但是我没有办法呀的产品解决方案。我于9/19/2018购买了一个,我既不知道好不好用也不知道怎么用,prime是两天寄到,9/21/2018我会收到产品,到底我能不能继续做虚拟女友计划102,我本周五才能知道了。
在我收到之前,我会先收集各种资料,进行有可能进行的学习,至少我现在刚刚知道什么是ARDUINO了。
[本帖最后由 nancyivy 于 2018-10-2 13:52 编辑] - 罪恶台球师
- jc2602建议你先学任天堂做个猫或者狗。
- kiveslz加油,万事开头难
- nancyivy这个也很有可能。如果某刻我认为,这个xyz我是真的做不下去了,在做xyz 之前我看来得先学abc,学会了再回来做xyz,那我一定如实记录下来。
- Artint嗯加油。
- tl123456万事开头难,加油
- kmp1987马克等进度,搞完别忘申请专利解放大家的小弟弟
- 发电俏娇娃有意思的精品贴
- nancyivy
全息投影仪收到了,研究后正在思考下一步的动作。
图中手机,iPhone 5c
[本帖最后由 nancyivy 于 2018-9-23 01:30 编辑] - 很苦的熊三D投影什么的东西都是虚的,只是个表现形式。第一步应该随便找个模型去还原一个显示器上能跑的角色。做出来了再去考虑建模和3D投影什么的。
- cqlyzz加油!!!
- yufe加油
- 腻水染花腥顺序反了,321
- nancyivy以上大家的意见、鼓励和建议我看了也很感谢,先等我把下一贴发出来,我会尽量写得很清楚我到底要干嘛,我的困惑和困难是什么,我以后打算咋样,说不清的地方拍视频说给大家看。
说清楚了之后,大家可能会更明白我对我DIY的成品的要求低到海平面以下去了,所以要完成DIY就更有可能性了。 - kagez啥意思?和5c一样高的的3d女友?
- lzj_freedomlz加油
- nancyivy哈哈,你是回复唯一一个关心这个问题的,我也关心这个问题。
- 百万负翁赞,祝楼主成功,
念念不忘,必有回响。
本帖最后由 百万负翁 于 2018-9-25 13:09 通过手机版编辑 - 欲薯临疯不明觉厉
- nancyivy我早就做好了102这一步也写好了,我已经在做下一步的工作了;没发出来是因为我这次用视频辅助
说明我的过程,这个视频发到bilibili楞是通不过审核,我觉得审了有大于24小时吧,才通过的
,我也没什么了不起的内容在视频里呀,这么普通的视频需要审这么久才通过吗?我以前也发过
视频到bilibili,从来不用审这么久,这次不明白是为什么。我同时也传到youtube了,那个不用
审一下子就发布了。 - 田中健一ai部分才是最难的。
- 鬼冢英吉看楼主什么时候放弃
- 北德文斯克挺有意思的
- ycsjtu有意思
- at89s52不错不错,密切关注中
- nancyivy傻瓜想做的语音交互到底怎么才能做出来:虚拟女友计划103
首先,各位ACM比赛大佬,机器人比赛大佬,各种编程大佬,硬件大佬,如果有人看我写的这种小白思路,希望你们不会被我气死或啰啰嗦嗦磨叽死。
我的设计思路如下:
我的最终计划也不包括做智能家电。完全没有。
我到底要实现什么?“我对她说HELLO,她要能对我说HELLO。”我首先定下就这一个功能,我就实现这一个东西。
本质上是,用声音触发她的状态A,没声音触发的时候她的状态就是B。
我一个小白理解这就是状态机(对,我不知道我在说什么)。
待机状态:状态B, 比如说就是一直播放跳舞的视频。没人触发,就一直跳舞。
触发状态:状态A,播放“hello”的声音。这时人物的3D模型怎么办,我首先想一个偷懒的办法,用一个水晶球之类的简陋的全息投影视频代替,也就是说我一跟她说话,她的全息投影就从跳舞的妹子变成抽象的水晶球,并播放“hello”的声音。播放完后,(可能应该停顿3秒?)回到跳舞状态。
怎么触发,用我说“hello”的声音触发,那这里涉及各种想法:
一定要“hello”吗,别的语句可不可以?
一定要我说吗,别人说可不可以?
一定要人声吗,其他不是人声的声音可不可以?
一定要声音吗,按按钮可不可以?
等等。
在我实际做的过程中,可能我做一个APP/软件的话,
首先我做一个按按钮来触发状态的小软件,如果顺利,再做声控触发(任何声音),如果顺利,再做人声触发(?),等等,看情况而定(也就是看我这么蠢会不会在哪一步做不下去了)。
另外声音方面现成的解决方案就是比如接入google assistant?具体说来,可能我不需要整个google assistant?如果用Unity, 可能要研究API.AI's Unity SDK。也有可能要研究其他,像是Google Cloud Speech API。(一概不懂是什么,名词都是网上搜来的。)
硬件方面就是要有麦克风,扬声器,作为声音的输入和输出。
对,这也会导致我考虑一个偷懒的方案和一个困难的方案。
想是这么想,在接下来学习的过程中,发现我想偷懒也偷不了懒,当然困难的方案还是很困难。 - nancyivy其实我也没逞强说什么大话呀,每一步都战战兢兢,随时可能卡死走不下去了
- nancyivy幻想有简单的方案只是因为没亲手做过:虚拟女友计划104
(幻想的)偷懒的方案:
本来全息投影就是靠手机播视频,那直接做手机APP,继续利用手机本来就有的硬件(麦克风和话筒),就不用再考虑格外的硬件了。
这个方案并不是没有问题,第一,这样解决问题,就相当于虚拟女友更没有实体感。除了全息投影,其他都在手机里,更没有“机器人”的感觉。
第二,我只有iPhone,如果我选google assistant做语音识别的解决方案,不知道iPhone apps+google assistant在iPhone上用会是什么体验...要是不行,我是不是还得买个Android系统的设备......我希望能少买硬件,控制成本,这种愿望不知能否实现。
刚刚看了一下,siri也开放给开发者了,我可以考虑这两种都试试......这第二个问题大概不算太大问题?
第三,不知道大家能不能理解,当我把手机架在全息投影仪上播视频的时候,我对手机进行按键、输入的操作会不太方便,所以最好还是能做成95%声控的(可能还是要按home键什么的)。如果我做不出声控的小软件,那我就卡死在这一步了。
说是偷懒的方案,其实也偷不了多少懒。
困难的方案:
硬件采用另外的处理器,麦克风,扬声器,那就是比如说我买个树莓派,ARDUINO之类,再买配套的麦克风,扬声器,再自制语音软件/接入google assistant之类的解决方案,(这里应该不能用siri?)
噢,还忘了,这要是不用手机播视频我还得另外给树莓派接投影仪类的设备以播放全息投影视频?也可以把树莓派和iPhone连接起来,把iphone当显示器用......(如果真能顺利做到的话。对此我十分怀疑。)
这种方案下来倒是更有实体感了,就是除了手机以外还有一大坨硬件,做出来不会太美观。可能我自己做个DIY的东西给自己也不需要考虑什么美观问题吧。
这种困难的方案另外还有一个好处就是,把手机架在全息投影仪上播视频的时候,有可能“按按钮”这种操作会稍微方便点(我猜的,我不知道我在说什么),因为在这种解决方案中手机只充当显示器的作用。
---------------------------------------------------------------------------------
实际在开始做简单的方案时,我死磕了很久“UNITY怎么做语音控制的游戏”?最开始发现UNITY有内置的语音识别游戏控制,好像真的很简单,但是只能在WIN 10上跑......相应的UNREAL也有可以在WINDOWS上运行的简单的插件。那如果想要在手机系统上运行怎么办?我死磕了很久,才理解到我根本可以抛开unity或unreal,因为我做的可能没那么复杂...?我根本不用把这个当做“游戏”?
我只是要:用语音控制同时播放一段音频和视频。(好吧,看来这个“同时播放”恐怕又没那么容易。)另外的状态播放另一段视频。
ios 10以上就有自己的speech recognizer。好吧,我以前也曾做过最简单的ios app,但是没做过这么难的(对,对我来说就是很难。) - 寂静狼简单看了下
虚拟投影之前略有研究,至于lz说的gatebox具体是哪种技术实现的目前我不得而知
,不过lz买的这种成本极低,适合新手玩
而且相对别的(比如ai训练部分)虚拟投影目前技术就这几种,都有现成解决方案建议先研究下其他部分
ai这块感觉比较头大,首先你说的这类现成的语音助手接口有限,可能并不能很好实现lz想要的功能
其次自己想要做个ai助理感觉基本无法实现,需要的软硬件投资都巨大
最后衷心祝lz成功