立花 和也 / kazuya.tachibana

自己紹介

東京出身、東京育ち たっち こと立花です。 趣味は一生探しているけど、一生見つからないです。 趣味探しが趣味とも言える気がします。
Voicyでは、iOSアプリの開発を主に行なっていますが、チームのリードとして開発効率の改善などもやってます。

Voicyの好きなところ

Give First精神で自分から先に動く人が多い

好きなVoicyパーソナリティ

カジュアルに話してみる

音声を聞いてみる

入社エントリー

登壇実績

ピックアップコンテンツ

音声ファイル内に歌や楽器の演奏が含まれているかをSound Analysisを使用して手軽に判別してみた - voicy tech blog
はじめまして。株式会社Voicy iOSエンジニアの立花 (@kzytcbn315) です。 先日、国内最大級のeスポーツイベントを開催するRAGEが開催するShadowverseというゲームの大会に参加して賞金を獲得しました。 ゲームをやってお金も貰える、なんともいい時代になったもんだなとしみじみと思いました。 RAGE Shadowverse 2022 Winter6-2でマネーフィニッシュ💴 Nm6-2B6-5 あと1勝できてれば プレーオフだった🥺(目無し同士だから勝てたんだけど)数千人参加の大会で上位100人以内に入れたので満足お小遣いゲットできたのでいい休日になった! pic.twitter.com/jbLmlez6Sh - Kazuya Tachibana (@kzytcbn315) 2022年11月12日 前置きが長くなりましたが、ここからが本題です。 昨今、AIの創作物の 著作権について議論されることが増えたと思いますが、音声コンテンツも 著作権 の侵害には気をつけなくてはなりません。 音を扱うコンテンツとして代表的なのは音楽だと思いますが、うっかり音楽が音声コンテンツに紛れ込んでしまった場合に 著作権 を侵害してしまう恐れがあります。 そこでふと、音声ファイルの中に音楽が含まれているのを手軽に検知する方法がないかな、と考えたのが今回の記事を書くきっかけになりました。 音声ファイルの中に音楽が含まれているかを検知する方法として、パッと思いつくのはShazamKitです。 ShazamKitはiOS15+の 音声認識用の フレームワーク です。 ShazamKit(またはShazamのアプリ)を使用したことがある方ならご存知だとは思いますが、ShazamKitの精度は手軽に使えるのに非常に高いです。 しかし、結論を言うとShazamKitを利用してもやりたいことは実現できないです。 ShazamKitは 音声認識用の フレームワーク なので、特定の音源を検知することは可能ですが、不特定多数の音源を認識することはできません。 Aという楽曲のオリジナル音源は特定することはできます。 ですが、Aという楽曲のカバー音源であったり、カラオケで歌った曲などは認識することができません。*1 これだと、Shazamに登録されているカタログ以外を検知できず不完全なものになってしまいます。 ShazamKitと同じような音声を扱うライブラリに、 Sound Analysis があります。 Sound Analysisは、iOS13以降から提供されている音声分類用の フレームワーク です。

テキストアウトプット