Youtubeの字幕機能を活用して,音声DBを作った話

はじめに

  • Youtubeの字幕機能を使って,動画のセリフと音声が紐付いたDBをつくった
  • ややグレー
  • サイトはこちら http://vtuber-db.site

使い方

http://vtuber-db.site

  • 日本語字幕がついているYoutube動画のURLを貼る f:id:danmakubi:20180331143650p:plain

  • 保存したいセリフを指定 f:id:danmakubi:20180331143823p:plain

  • 作成 f:id:danmakubi:20180331143925p:plain

処理の流れ

  • 貼られたURL(https://www.youtube.com/watch?v=03H1qSot9_s)の動画ID(&v=xxxxxxx)を使って字幕を取得
  • 字幕のURLはこんなかんじ http://video.google.com/timedtext?lang=ja&v=#{video_id}
  • lang=jaで字幕の言語を指定
  • ちなみにhttp://video.google.com/timedtext?type=list&v=#{video_id}とすると,どの言語の字幕があるかというリストを返します

  • 字幕はXML形式で取得できる f:id:danmakubi:20180331144745p:plain

  • これが字幕の最小単位

<text start="0" dur="3">10分ちょっとで分かる月ノ美兎</text>
  • 各字幕は,動画中の開始時間(start="0")と,再生時間(dur="3"※終了時間ではない)を持つので,これを使って動画を切り取る

  • Youtube動画URLから,実際に動画が置かれているCDNのURLを取得するのにyoutube-dlを使う

  • 動画を切り取るにはffmpegを使う
$ youtube-dl --get-url #{動画URL}
$ ffmpeg -y -ss #{開始時間} -t #{再生時間} -i '#{CDNのURL}' #{output_filepath}
  • 細かい説明は省いていますがだいたいこんなかんじ

pairsを承認欲求を満たすツールとして考える

はじめに

pairsを1ヶ月ほど使ったのでなんか書く.男性視点で書きます.

ちなみに出会えてませんがこれは特にサービスが悪いわけではないです.1ヶ月しかやってないし.

あと,こんな泡沫ブログが金貰って書いてるわけ無いでしょ勘違いしないでよね.

pairsについて軽く説明

出会い系アプリ(サイト)です. 出会うまでの流れとしては

  1. 女性に「いいね」を送る
  2. 女性が「いいねありがとう」をする(承認的な機能)
  3. マッチングが成立し,メッセージを送信出来るようになる.
  4. pairs上でメッセージをやり取りして,仲が良くなったらLineに移行したりしなかったりする
  5. 更に仲を深めていい感じになったら会ったり,会わなかったりする

…という感じです. 男性は基本金払わないと使えないのですが,詳しいシステムはggってください.

「いいね」が承認されたときの承認欲求の満たされ具合は結構すごい

「いいね」は女性からも送れるのですが,お姫様気質な女性が多いのか,基本的には男性がいいねして女性がそれを承認するというフローになります.

で,このいいねが承認されるというのが感覚的にはTwitterでリフォローされるとか,絵をfavされるようなものなので,なかなか承認欲求が満たされます.

まず,前提としてpairsをやっているということは,付き合うことをある程度見据えた上でコミュニケーションを取っているわけなので,いいねを承認されるということは「まあ,お前と付き合うかはまだわからんが完全にナシではない」という解釈をしてもいいと思うわけです.

なので,おちんちんと脳みそが脊髄で直結している男性はいいねを承認されるととっても嬉しいのです

女性とローリスクで会話ができる

マッチングが成立するとpairs上でメッセージのやりとりをすることになります.

同年代の女性と無限にlineができるような人間ならいざしらず,僕はカーストの下層に位置する人間なので,画面越しに女性と話すことなんて事務連絡ぐらいしかないですし,仮にそんな機会があったとしても会話のドッジボールになって終わります.

まあ,女性との会話に限った話ではないですが,やっぱり人は相手にどう思われているのか意識しながら会話してしまうので,どうしても重要な場面になればなるほど会話がぎこちなくなってしまうと思います.

その点,pairsでの会話なんて,別に飽きたらブッちすればいいし,マズったらブッちすればいいし,完全に自分の性格さらけ出して会話したところで痛くも痒くもないわけです.

尖った性格してる人は,本性出せば出すほど相手と仲良く慣れる確率は下がる気がしますが,まあ合わない人と無理して仲良くなるよりかはマシだと思います.

pairsのしんどいところ

いいこと結構書いてるように思いますが,しんどいと思うところもそれなりにあります.

  • メッセージのテンポが遅い(1日2~3往復)ので冷めやすい
  • 話題作りがしんどい
  • 接点ゼロからのスタートはやっぱしんどい

メッセージのテンポがだいたいTwitterのリプくらいのペースなんですが,そのテンポで相手と仲良くなるための会話を続けるってなかなか難しいです.

Twitterみたいに適当に絡んで適当なタイミングで会話切れるなら気持ち的にも楽ですが,知らん奴とLine上だけでデートまでこぎつけろって言われたらなかなか難しいですよね?

おわり

飽きたので終わります.

質の高いfavが欲しい人は月額3000円ぐらいでできます.

Google Speech API メモ

完全自分用メモ

結論

  • 日本語は滑舌良い,かつ録音環境良い,じゃないと精度出にくい感じ

APIの有効化

クレカ登録したりしないといけないのでだるい.

qiita.com

ファイル形式の変換

wavかflacにしとく

ffmpeg -i @"1.m4a" -vn -ac 2 -ar 44100 -acodec pcm_s16le -f wav "1.wav"

curlぶっ叩く

GitHub - gillesdemey/google-speech-v2: Reverse Engineering Google's Speech To Text API (v2)

  • audio/l16:wavの場合はこれ.拡張子ごとにContent-Typeを指定する必要がある
  • rate=44100:サンプリングレートも正確に指定する必要があるっぽい
curl -X POST --data-binary @'1.wav' --header 'Content-Type: audio/l16; rate=44100;' 'https://www.google.com/speech-api/v2/recognize?output=json&lang=ja-JP&key={ここにAPIキー}'

# => {"result":[]}
# => {"result":[{"alternative":[{"transcript":"フォンテーヌ ボルボ","confidence":1},{"transcript":"フォンテーヌ 包丁"},{"transcript":"フォンテーヌ ボツボツ"},{"transcript":"本当 メートル 坪"},{"transcript":"フォンテーヌ ぼつぼつ"}],"final":true}],"result_index":0}

iPhone7を買った人もそうでない人もBluetoothイヤホンを使おう

はじめに

BlueToothイヤホン「EARIN」の布教記事です.

EARIN以外にもBluetoothイヤホンはいっぱいあるんだけど,なぜEARINかといえばだいたいbackspacefmのせい. Latest Episodes – backspace.fm

あくまで,ライトに音楽を楽しみたい人向けです. 4,5万のイヤホン使ってたり,ポタアン持ち歩いている人は対象としていません.

iPhone7になってからイヤホンジャックが無くなりましたが,付属の変換アダプタ使ってイヤホン刺してる人ってどんくらいいるんでしょう.僕は使ってないです. AirPodsはまだ発売してないのかな?でもあれはカナル型じゃないからあまり好きじゃない.

iPhone7にした人はこれを機にBluetoothイヤホン始めませんか? そうでない人でも電車通勤が多い人とかはBTイヤホンおすすめです.

EARINとは

超コンパクトなBluetoothイヤホンです.だいたい2万円ちょい.

EARIN | MODERNITY - モダニティ株式会社 http://www.modernity.jp/wp/wp-content/themes/modernity/images/brand/earin/product/earin/10.jpg

いいところ

  • 片耳でも聴ける
  • ケーブルが無いのでタッチノイズが発生しない
  • カバンの中でケーブルが絡まったりしない

他にも細かいことはあるけど,ほとんどこの3つの為に買ったと言ってもいい. ケーブル類のストレスから開放されるのがマジ幸せ.

あと,片耳難聴の人もわざわざ片方のイヤホンだけ切り落としたりする必要がない.(少数派)

danmakubi.hatenablog.com

わるいところ

  • 高い(2万円ちょい)
  • スマホとペアリングする微妙な時間がだるい
  • 静かな場所でボリュームを小さくして聞くとホワイトノイズが目立つ

対して気にならないこと

  • なくしそう(ケースに入れてるんだからなくさない)
  • 落としそう(歩きながら取り出すな)
  • 充電が気になる(スマホと違って常に残量が見えてるわけじゃないので気にならない)

おわり

BTイヤホンに対するデメリットの感じ方は個人がどのようにイヤホン使うかでまちまちなので,人によりけりとしか言えない. まあ,結局メリット>デメリットなら買いって話だし.

ApplePayでe-Passを使う

概要

ApplePayが来たのでiPhoneでリフレクとか弐寺がやりたい. 後述するけど,実態としてはSuicae-Amusement Pass代わりにしてるだけ.

youtu.be

準備するもの

  • iPhone7/iPhone7 Plus
  • suica
  • 今使ってるe-pass
  • e-passをKONAMI IDに紐付けておく

やりかた

iphonesuicaを登録

  • とりあえず普通に「pay(正しい名前忘れた)」「wallet」アプリでiphonesuicaを登録
  • 登録に使ったsuicaカードはただの紙屑となる

iphoneに登録したsuicaのカードナンバーを調べる

  1. iPhoneを筐体にタッチ
  2. 「新規登録」と「データ引き継ぎ」みたいに二つ出ると思うから「データ引き継ぎ」の方を選ぶ
  3. 16桁のカードナンバーが出るのでメモる

画像はリフレクでやったとき f:id:danmakubi:20161027115821j:plain

e-passのデータをiphone内のsuicaに引き継ぎ

  1. e-amusementに飛んで引き継ぎのページを表示
  2. 「参照中のe-AMUSEMENT PASS」が今使ってるe-passの番号か確認
  3. 「引き継ぎ先のe-AMUSEMENT PASS」にさっきメモった16桁のカードナンバーを入れる f:id:danmakubi:20161027120855p:plain eAMUSEMENT

おわり

お疲れ様です.これでiphoneを「シャリーン」すると多分いけるはず.

UbuntuでAndroid Studio環境作ってたらつまづいた話

自分用でメモ

 

結論

askubuntu.com

 

 

何をしたか

原因はよくわからんけど,adb関係のインストールとかPATHとかでやらかしてたんだと思う.

とりあえず回答の通りにzip落として,解凍して,~/Andoroid/Sdk/platform-toolsを落としてきたやつに差し替えたら動いた.

イラスト投稿SNSにおけるタグ検索評価

主にpixivとニジエでタグ検索したときの検索結果を評価する.と言う名のシコれる絵がよく見つかるタグはどれだ!?みたいな.

まぁ,人によって性癖は異なるのであてにはならんでしょうけどツイートするには長すぎるのでこっちで適当にまとめたかった.

 

 

快楽堕ち

 このタグは幅が広いので非常に優秀です.快楽堕ち自体はそこまで好きでもないんですけど,快楽堕ちというジャンルが「アヘ顔」,「洗脳」,「薬物」,「目がハート」,「調教」等々,一つのタグで多くの要素を含むので検索結果の量,質ともに良質です.更に,自分の好きなタグと組み合わせて使うことでより質を高められます.

 

 

機械姦

 これも結構,検索結果の質はいい方だと思います.ノイズも少ないですしね.装置を描く技術が必要ってとこでフィルターかかってるのかもしれないですね.ただPoserMMD系の作品がチラホラ見られるので,苦手な方はアドオンとか使ってミュートして,どうぞ.因みに僕は大好きです.

 機械姦は強制絶頂シチュとか機械で恥部が見えない表現とかいいですよね.

https://nijie.info/view.php?id=153649

[R-18] 【クリ責め】「突起処刑マシン」イラスト/赤提灯 [pixiv]

 

 

縦割れアナル

 縦割れアナルってタグは思ったりより認知度が低い感じがあるんですよね.3次元だと縦割れアナルよく見かけるんですけど(男のアナル拡張動画とかだけど).似たようなので「アナルの造詣が深い」ってタグもあるけどあっちは評価としては微妙です.画力の高いだけのアナル絵にも安易に付けられる傾向があるので,シコリティの評価と比例しないところが使い勝手悪いです.ただ他のタグと組み合わせれば使えるかも?あ,「ぽっかりアナル」は言うまでもなく優秀なタグだと思います.

 

 

着衣脱糞

 スカトロは範囲が広すぎるし,ノイズも多いのでこっちをよく使います.着衣脱糞はハードなお漏らしって感じするし,わざと着衣脱糞してても変態性が高いのでシコリティ高いです.検索結果も死ぬほど多いわけじゃないのでチマチマ検索しつつ,好きなスカトロ絵師を厳選すると良いでしょう.

 

 

おむつ,露出

 この2つは厳選が重要です.何故かシコリティの高い絵と低い絵の落差が大きいという.思うにシチュエーション重視なところがあるからではないかと.特に露出は漫画とかCG集とかシチュエーションが細かく丁寧に描写されているものだととてつもなく良いです.おむつはpixivではノイズが多いので役に立ちません.好きなおむつ絵師を見つけましょう.

 

[R-18] 【漫画】「C89新刊」漫画/ミクニ [pixiv]

 

[R-18] 【漫画】「C86新刊サンプル」漫画/実験四郎 [pixiv]

 

 

おわり

 なんかもっとありそうだけど今はこれだけ.「なんだ,メジャーどころばっかじゃん」とか思うかもしれないけどマイナータグとか使ってもすぐに見尽くしてしまうので役にたたんのです.寝ます.