AIを使った音声圧縮で従来の圧縮を超えた技術「Encodec」が実現

1: 少考さん ★ 2022/11/02(水) 11:41:28.82 ID:1yCjsFgg

AIを使った音声圧縮で従来の圧縮を超えた技術「Encodec」が実現
https://gigazine.net/news/20221102-ai-compress-audio/

2022年11月02日 08時00分

ガブリエル・シナエーブ氏らによるMeta AIの研究チームが、インターネットにおける音声の「圧縮」に対してAIを用いることで従来の圧縮よりもさらなる圧縮が可能である、という研究を発表しました。AIを用いた圧縮により、豊かなマルチメディア体験を楽しむことができると説明しています。

Using AI to compress audio files for quick and easy sharing

今日のインターネットにおいて「圧縮」はなくてはならない要素で、圧縮により、高品質な画像やストリーミングが可能になります。しかし、現状の圧縮技術には高速なインターネット接続と十分なストレージ容量が必要になり、高品質で中断のないインターネットは一部の人しか体験できません。

そこでMeta AIの研究チームは、AIを用いてオーディオデータを圧縮することを研究しています。AIを用いたアプローチでは、リアルタイムで音声を圧縮・伸長させ、最先端のサイズ縮小を実現することができると発表しました。今回の研究では64kbpsのMP3と比較して、約10倍の圧縮率をCD品質である48kHzサンプリングのステレオ音声で品質を落とすことなく実用化しています。

(略)

※省略していますので全文はソース元を参照して下さい。

2: 名無しのひみつ 2022/11/02(水) 11:49:56.61 ID:BbeVV9t4
圧縮データを再生したら捏造音声になってたアル

 

3: 名無しのひみつ 2022/11/02(水) 11:58:44.43 ID:fXRDRzOp
昔からあるオートエンコーダーでも65kbyteを4byteくらいへ圧縮できるよな

 

4: 名無しのひみつ 2022/11/02(水) 12:09:42.67 ID:PluUUriP
実物の音声を聞かなければなんとも

 

5: 名無しのひみつ 2022/11/02(水) 12:13:08.14 ID:PluUUriP
実物の音声を聞いた
たしかに圧縮はうまく出来てるんだろうが
CD音質というのはおそらく嘘だと思う

 

13: 名無しのひみつ 2022/11/02(水) 13:01:53.37 ID:lmbQEGPm
>>5
可逆圧縮では無いからな
不要な成分が割と定位や解像度に関わってたりするし

 

36: 名無しのひみつ 2022/11/03(木) 17:52:03.89 ID:YcMG71Wh
>>5
多分JPEGとかと同じで不可逆圧縮なんじゃね
音質は普通に上げられると思う、ただし、原音と1bitも違わない、とは言えないだろうが、
人の耳では全く分からんというか、当人でも当然毎回同じようには歌えないのと一緒で
その程度の違いしかないんじゃないのかね

 

6: 名無しのひみつ 2022/11/02(水) 12:13:32.14 ID:IiTysW0M
AIがファイル名を見てテキトーに考えて音を合成する様にすると、全ての音データは数バイトで表現できるようになる。

 

7: 名無しのひみつ 2022/11/02(水) 12:28:22.93 ID:tTrxIigp
音声圧縮なのにmp3と比較の時点でなあ
AMRと比較しないと同じ土俵にならないでしょ

 

8: 名無しのひみつ 2022/11/02(水) 12:29:00.97 ID:dMci+4PL

>>1
>。今回の研究では64kbpsのMP3と比較して、

320kbpsと比較しろよ…

 

11: 名無しのひみつ 2022/11/02(水) 12:56:03.09 ID:BuhOOiqS
>>8
ネットのストリーミングで320kbpsなんて使ってるサービスは無いんだから比較する意味がない

 

15: 名無しのひみつ 2022/11/02(水) 13:16:22.51 ID:dMci+4PL
>>11
なぜネットストリーミングの話に限定するの?

 

9: 名無しのひみつ 2022/11/02(水) 12:38:12.71 ID:bkLuaIZI

これ最近AIがやった未知の数式変換と同じだよな
結果が似たような物になるなら既存の法則をぶっ壊しても構わないってやつ

あれはほぼランダムに見える炎の動きを圧縮してたが、これ系の分野はまだまだ伸びると思う

 

30: 名無しのひみつ 2022/11/02(水) 16:32:00.15 ID:UrhKjCcZ
>>9
あれは人類が知らない係数を発見したって話じゃなかったっけ?
それを未知の数式変換と表現してるならすまん

 

10: 名無しのひみつ 2022/11/02(水) 12:48:30.25 ID:PluUUriP
これトレーニングしたモデルは
他の音源でも同じように圧縮に使えるの?

 

12: 名無しのひみつ 2022/11/02(水) 13:01:25.93 ID:lmbQEGPm
普通は圧縮に可聴域以外の音域や音量低い部分とかの切り取りがあるからな
ロスレスかそれに準ずる位の細かいモジュール化が行われているんだろうか
例えば倍音成分を補完する事をカーオーディオ等では二十年程前から既にやってるよな
機能を振り分ければある程度は再現可能だから、並列処理させるための手法を編み込んだ即席リマスターの応用みたいなもんだろうか
と思ったら全く同じことが書いてあった
具体的に何してるかは良くわからんけど

 

26: 名無しのひみつ 2022/11/02(水) 15:17:10.37 ID:lmbQEGPm
>>12を訂正
全く同じって事は無いな

 

14: 名無しのひみつ 2022/11/02(水) 13:05:08.68 ID:tmM6Hmbc
圧縮率上げると時間かかるんだよな
ものによるしな

 

16: 名無しのひみつ 2022/11/02(水) 13:25:13.22 ID:lmbQEGPm
というか音声サンプルではチリンチリン鳴るアレの音が一切しないな
可聴域の音まで削れてるわ

 

18: 名無しのひみつ 2022/11/02(水) 14:21:48.61 ID:AzT2MOsS
>>16
元々CD品質には程遠い64kbpsのmp3相当の品質を6kbpsで実現するってだけ
既存の技術だとたぶん16kbpsぐらい必要だったのが半分ぐらいになるかもって話だな

 

19: 名無しのひみつ 2022/11/02(水) 14:37:17.69 ID:lmbQEGPm
>>18
なるほど目的というか目標は耐えうる音声を目指すことか
最大の圧縮率を目指すんだから配信サービスでの利用云々は違うわなぁ
音も良くて圧縮率も高いなんて欲張りは出来ないよな

 

17: 名無しのひみつ 2022/11/02(水) 13:58:08.89 ID:scNNY3Vk
年寄りとか女の話が長いから
要約してくれるAIはないかな

 

20: 名無しのひみつ 2022/11/02(水) 14:48:32.35 ID:CDMQ3yby
>>17
ただ思ったことをそのまま口に出してるだけだから訳せないと思う!

 

21: 名無しのひみつ 2022/11/02(水) 14:58:30.05 ID:iTL3PWEU
楕円関数の暗号化技術を使う?

 

24: 名無しのひみつ 2022/11/02(水) 15:15:19.09 ID:dMci+4PL
>>21
それはハッシュ関数であって圧縮とは関係ない

 

22: 名無しのひみつ 2022/11/02(水) 14:59:50.79 ID:MQye9Vb4
インターネットでは多くの場合、音声と動画像はセットで扱われることが多い。
音声の圧縮率が上がっても、全データ量には、ほとんど影響しないダロ。

 

23: 名無しのひみつ 2022/11/02(水) 15:06:12.80 ID:uTZP8xUm
今、AM放送で使われている1000khzくらいの搬送波でも音声のデジタル化が出来そうだね。

 

25: 名無しのひみつ 2022/11/02(水) 15:16:42.49 ID:uTZP8xUm
>>23
アメリカではとっくの昔にHDラジオってのが始まっていたのね、、、

 

27: 名無しのひみつ 2022/11/02(水) 16:21:55.45 ID:xBjqmfA7
理論家が一生懸命考えたものを機械学習で
ぶっ飛ばすとたまらんな

 

28: 名無しのひみつ 2022/11/02(水) 16:26:51.09 ID:lmbQEGPm
>>27
基礎になってる理論とは別問題だろ
素地は明らかに既存の圧縮方法だけなんだが
ぶっ飛ばすてなに?w

 

29: 名無しのひみつ 2022/11/02(水) 16:28:08.82 ID:6urVRuYI
圧縮率上げると時間かかるんだよな
ものによるしな

 

31: 名無しのひみつ 2022/11/02(水) 16:40:21.07 ID:lmbQEGPm
物理法則にもAIが発見したとされるなんらかの物理定数のニュースがあったけど、巨視的な規模なのか微視的な規模なのかを上手く説明してる記事では無かった
AIの発見を間接的にでも説明出来るのがAIだけになる日も近いな

 

32: 名無しのひみつ 2022/11/02(水) 17:55:52.74 ID:Q40qEjHR
>>1
円光でっか

 

33: 名無しのひみつ 2022/11/03(木) 07:16:15.58 ID:RRXLdSBY
そう思うと楽譜って圧縮率すごいな

 

34: 名無しのひみつ 2022/11/03(木) 17:16:58.16 ID:i7XotSvL
>>33
正確に解凍するのにめちゃくちゃ時間かかるぞ

 

35: 名無しのひみつ 2022/11/03(木) 17:36:23.94 ID:kNzIdCHL
クラウドストレージのデータは人知れずこういう学習に使われてんだろうな

 

37: 名無しのひみつ 2022/11/03(木) 19:26:51.43 ID:ZJI1FgEl

送りAI青い空って曲だ
受けAI青い空のCDかけますね

圧縮率100万倍w
こうですかw

元スレ:https://egg.5ch.net/test/read.cgi/scienceplus/1667356888/l50

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA