1、舞蹈比对
希望练习跳舞的学生能够迅速知道自己的动作错在哪里,用普通摄像头即可。
技术很简单用开源的关键点检测如OPENPOSE,然后做一些几何上的运算
2、舞蹈生成
训练集是许多开源的mikumikudance文件,用RNN生成3D舞蹈动作序列。最后结果比较鬼畜,于是放弃了。应该先尝试一下2D的,有现成的论文
3、音乐合成
用普通的基于RNN的语音合成系统改造成音乐合成系统,仅仅手工调整每个发音的时长和基频即可。乐谱需要手动录入,或者通过洛天依的VSQX文件导入。效果比调教之前的v家流畅不少,外行听起来效果还不错。
后续希望通过语音识别,自动把歌词和乐谱扒出来。
4、说唱规划
希望根据用户上传的任意文本,自动生成并演唱一段RAP,并嵌入到固定的背景节奏中去。
希望练习跳舞的学生能够迅速知道自己的动作错在哪里,用普通摄像头即可。
技术很简单用开源的关键点检测如OPENPOSE,然后做一些几何上的运算
2、舞蹈生成
训练集是许多开源的mikumikudance文件,用RNN生成3D舞蹈动作序列。最后结果比较鬼畜,于是放弃了。应该先尝试一下2D的,有现成的论文
3、音乐合成
用普通的基于RNN的语音合成系统改造成音乐合成系统,仅仅手工调整每个发音的时长和基频即可。乐谱需要手动录入,或者通过洛天依的VSQX文件导入。效果比调教之前的v家流畅不少,外行听起来效果还不错。
后续希望通过语音识别,自动把歌词和乐谱扒出来。
4、说唱规划
希望根据用户上传的任意文本,自动生成并演唱一段RAP,并嵌入到固定的背景节奏中去。