特集 2013年9月22日

コンピューターにダジャレを教える

テキストばかりの地味なページですので、先に華やかな海鮮丼の写真をごらんください。
テキストばかりの地味なページですので、先に華やかな海鮮丼の写真をごらんください。
駄洒落の歴史は古い。適当な言葉の語源を調べていると江戸時代の駄洒落に行き当たることがあるし、平安時代の短歌にも今で言う駄洒落みたいなのがいっぱい入っている。

人類はいったい何年、駄洒落を作っているのだ。そろそろ駄洒落くらい機械に作らせて、空いた時間で二度寝とかしようぜ。
インターネットユーザー。電子工作でオリジナルの処刑器具を作ったり、辺境の国の変わった音楽を集めたりしています。「技術力の低い人限定ロボコン(通称:ヘボコン)」主催者。1980年岐阜県生まれ。
『雑に作る ―電子工作で好きなものを作る近道集』(共著)がオライリーから出ました!

前の記事:野良バーコードを読む

> 個人サイト nomoonwalk

駄洒落にもいろいろある

駄洒落といってもいろいろあるが、今回言ってるのはこういうやつである。

・江戸川乱歩(エドガー・アラン・ポー)
・ハイファイ新書(解体新書)
・水曜どうでしょう(金曜ロードショー)
・キャバクラ幕府(鎌倉幕府)

「ふとんがふっとんだ」「ねこがねころんだ」式の、一文に同じ音を2回含ませる、いわゆるおやじギャグは今回は対象外。

注目したいのは文中に原文が出てこない、「もじり」の駄洒落だ。30代以上の人に一発でわかる説明をすると、ボキャ天方式の駄洒落である。

なぜか、おやじギャグではないの側の説明の方がオヤジ臭くなってしまった。

そんなもん機械にやらせろ

というわけでコンピューターにダジャレを作らせるプログラムを書いてみた。駄洒落生成プログラム第一号だ。
たとえば前述の例にならい、「かまくらばくふ」を入れてみよう。
コマンドにつづいて、原文の文字を入れると
コマンドにつづいて、原文の文字を入れると
こういうふうに、似た語感の言葉と、使った単語が出てくる
こういうふうに、二行目に駄洒落、それ以降には使った単語が出てくる
寒川は神奈川の町名。ここに地名を入れてくるのか
寒川は神奈川の町名。ここに地名を入れてくるのか
西洋かぶれな上に高級感出してきた
西洋かぶれな上に高級感出してきた
急にかわいくなった
急にかわいくなった
なんかちょっと思ってたのと違うが、ちょっとまって!一つ一つ口に出して発音してみてほしい。「かサクラ マスふ」も「かまPRA DAくふ」も、音は意外に「鎌倉幕府」に近いのだ。なぜなら、母音を一致させてあるから。

たとえばアルパカ(ARUPAKA)は母音だけ抜き出すと「AUAA」で、鎌倉幕府の「まくらば」の部分も「AUAA」。だからそこを入れ替えて「かアルパカくふ」だ!という手順で駄洒落をつくっている。

こういう手順のことをアルゴリズムというのだけど、このアルゴリズムを改善していって、より面白い駄洒落を作ろうというのがこの記事の目的である。
さっきと同じプログラムだけど、うまくいくと2単語入るときもある(サカつくはゲームの名前です)
さっきと同じプログラムだけど、うまくいくと2単語入るときもある(サカつくはゲームの名前です)
もはや全く原形をとどめていない
もはや全く原形をとどめていない
こういうのがもう無限に出てくる
こういうのがもう無限に出てくる
これを駄洒落というにはちょっと自由すぎはしないだろうか。なんたって「砂漠化タブウ」である。鎌倉幕府よりは「大魔神サタン」とかに近い。コンピューターに駄洒落を教えるのが目的の本稿だが、すでに学級崩壊だ。

片手はあけておけ

考えてみれば、たとえば「ハイファイ新書」はちゃんと解体新書の「新書」を残すことで「ハイファイ」とのギャップが生まれ、全体の面白さに繋がっている。「鎌倉」も「幕府」も消して「砂漠化タブウ」だと何が面白いかさっぱりわからないのだ。

こちらも片方残すことにしよう。
プログラムを変更、漢字で書いた部分はそのまま残るようにした
プログラムを変更、漢字で書いた部分はそのまま残るようにした
おっ、ちょっと絵の見えるおもしろさ
おっ、ちょっと絵の見えるおもしろさ
マナグア=中米・ニカラグア共和国の首都、というのを知っていれば面白いかもしれない
マナグア=中米・ニカラグア共和国の首都、というのを知っていれば面白いかもしれない
坐薬とか言って喜んでるの、小学生の考えた駄洒落っぽくていいぞ
坐薬とか言って喜んでるの、小学生の考えた駄洒落っぽくていいぞ
鎌倉のほうを生かすとこうなる。そういうボタン屋、普通にありそう
鎌倉のほうを生かすとこうなる。そういうボタン屋、普通にありそう
爆笑とは言わないけど正直ちょっとだけ噴いた
爆笑とは言わないけど正直ちょっとだけ噴いた
だいぶ駄洒落らしく、シュッとしてきた。かつては学級崩壊の先陣を切っていたわが子も、無事に義務教育は終えた感じがする。

こうなるともうちょっと欲が出てくる。駄洒落らしさは十分身についたので、今度は「巧みさ」みたいなのが出てるといい。高校は進学校に入って、いい大学にいって、将来は官僚になって親を楽させてほしい。

母音だけで満足しないこと

最初にあげた例を振り返ってみると、「ハイファイ新書」と「解体新書」は「○い○い新書」が同じ。

一見かかってることがわかりにくい「水曜どうでしょう」と「金曜ロードショー」も、「○曜○○○ショー」が同じだ。

母音だけじゃなくて、いくつかの文字は子音もまるっとあってるのだ。同じように、このプログラムも単語の何文字かはまるっと一音あわせることにした。まずは「かまくら」の4文字中、1文字をあわせてみよう。
鎌倉時代にヤフーニュースがあったらのコメント欄に書かれてそうな揶揄
鎌倉時代にヤフーニュースがあったらコメント欄に書かれてそうな揶揄
一方、ひねりのない直球の悪口
一方、ひねりのない直球の悪口
スマップが将軍に扮して出てくるテレビ番組ありそう。(「生スマ」自体はスマイレージっていうアイドルのUSTREAM番組だそうです)
スマップが将軍に扮して出てくるテレビ番組ありそう。(「生スマ」自体はスマイレージっていうアイドルのUSTREAM番組だそうです)
うーん、1文字あわせたくらいだと前とあんまり変わらない気がする。

では2文字。「かまくら」の4文字のうち半分まであわせたらどうか。
価格.comで調べてから買うタイプの幕府
価格.comで調べてから買うタイプの幕府
うっ、このぐらい絞り込むと今度は使える単語が限られてくるようで、知らない地名や同じフレーズばかり出てくるようになった。
うっ、このぐらい絞り込むと今度は使える単語が限られてくるようで、知らない地名や同じフレーズばかり出てくるようになった。
そして……。
でたよ
でたよ
ここまで駄洒落の精度を上げるため、プログラムを書き、駄洒落を研究し、また書き直し……と重ねてきた。その積み重ねで、学級崩壊状態だった駄洒落をここまで洗練させてきたのだ。とにかく洗練に洗練を重ねた結果、たどり着いたのはこれ。

「キャバクラ幕府」

我々は仏の手の上で踊らされていたのである。

幕府に思い残すことなし

せっかくなので他のフレーズもやってみよう。ハイファイ新書や水曜どうでしょうを越える名タイトルが生まれるかもしれない。
新書っていうか白書って感じ
新書っていうか白書って感じ
なんかパクリっぽいのがきたぞ
なんかパクリっぽいのがきたぞ
読書に集中できなそう
読書に集中できなそう
逆ギネスブック
逆ギネスブック
次は金曜ロードショー。実は「ロードショー」と「どうでしょう」は母音が完全一致してない(oooooとoueou)。のでこちらも母音は一部ゆらいでもいいように、プログラムを変更した。
これ語感もいいし、ボージョボーってなんだろうと思って画像検索したときの意外性もナイス→これ</a>
これ語感もいいし、ボージョボーってなんだろうと思って画像検索したときの意外性もナイス→これ
周辺国家による「あいつはフォローしない」政策によりSNSで孤立する金朝(12世紀の中国の王朝です)
周辺国家による「あいつはフォローしない」政策によりSNSで孤立する金朝(12世紀の中国の王朝です)
金包は結納金のことだそうです。強烈にめでたそうなので紹介しておきます。ドードーーって
金包は結納金のことだそうです。強烈にめでたそうなので紹介しておきます。ドードーーって
という感じでそこそこの佳作は登場するんだけど、ハイファイ新書や水曜どうでしょうクラスの傑作まではなかなか至れない印象。たぶんもっと面白くするには単語の意味まで考えて、遠い意味の言葉を組み合わせたりしなきゃいけないんだろうな。

とはいえしかし、当初の「砂漠化タブウ」がその後「マナグア幕府」→「ガラクタ幕府」→「価格差幕府」と進化してきたことを考えると、ひとまず駄洒落生成プログラムを名乗るには十分な完成度に達したのではないかと思う。

そういうわけで、次のページではプログラムを生かして人間には思いつかない駄洒落を考えます。
いったん広告です
引き続き地味なページが続きますので、先にまぶしいイクラ丼の写真をお楽しみください。
引き続き地味なページが続きますので、先にまぶしいイクラ丼の写真をお楽しみください。

寝てる間に機械が駄洒落をつむぐ

さて、前ページまでで駄洒落生成の自動化は成功した。自動生成に成功するとはどういうことか、まずはその威力を皆さんに味わってもらおう。

下の画像を見てほしい。
!
これは歴代の総理大臣76人の名前を使った駄洒落を、それぞれ100本ずつ生成して一覧表にしたものだ(安倍さんみたいに非連続で再選した場合は2回登場します)。

この物量感、圧倒的!画像をクリックすると拡大画像に飛ぶのでそちらも見てみてほしい。

これを生成するのに約4200秒かかった。生成速度は約2DpS(Dajare per Second)。プログラムとしては改善の余地ありだが、すでに人力よりはるかに早い。途中で飽きたりもしない。しかもその間、僕はただゲームをやっていただけだ。

駄洒落自動生成がいかに画期的か、わかってもらえただろうか。ちなみに僕のお気に入りの歴代首相駄洒落は「ビョークま重信」である。

※全部チェックしてないので文字化けや重複、失礼なダジャレ等あるかもしれませんが、すみません。

長編駄洒落にチャレンジ

長文の駄洒落というのはあんまりきいたことがない。単に考えるのが大変だからだろう。(そして披露しどころもない)

しかし今回は駄洒落をオートメーション化することに成功したのだ。現代のCPUなら長文も一瞬でお手の物である。

たとえば、おなじみ、平家物語の冒頭である。

祇園精舎の鐘の声
諸行無常の響きあり
沙羅双樹の花の色
盛者必衰の理をあらわす



この例文を駄洒落にしてみよう。
!
鐘の音が音速(普通)、まじめに話してるときにいきなり登場する「イキナリ!」、加賀野井さんというのがサラドル(消費者金融のCMに出てるアイドル)なのだろうか。生粋の人が盛者になるのだ、という捻りのないことわり。

全体的にすごく浅い話になってしまった。古典の含蓄を思い知る結果である。
もう1本だけ紹介しよう。
!
ちょっと全体に意味がわからないことになっているが、最後の「盛者必衰のことダヴィド・アラバす」だけが妙にかっこよくて笑ってしまった。ちなみにオーストリアのサッカー選手だそうです。

カオスへのアクセス

で、これいま文を細かく分割して投入してる(結果で半角スペース空いてるところ)のでわりと読みやすい置き換えをされてるのだが、分割しないと自由な置き換えをされてすごいことになる。前ページでいう最初のプログラムの状態に近い(その後に入れた改造は残ってるのでちょっと違うけど)。

改めて、そこに平家物語を突っ込んでみよう。
軽く文字化けかと思うようなカオスが現れた
軽く文字化けかと思うようなカオスが現れた
ことわりをアザース!
ことわりをアザース!
さらに、いまはこれでも改行のところで分断されてるので、改行も取っ払ってみる。

ついでにもっと長くしてみよう。
この物量感。重い
この物量感。重い
圧を感じる
圧を感じる
駄洒落というよりもう暗号化である。この暗号文を原文と比較してみよう。単語の読み方は上に貼ったキャプチャを参照してほしい。

祇園精舎の鐘の声
ぎ温浴じゃのカテコこえ

諸行無常の響きあり
しょ揚子江土肥氏きアキ

沙羅双樹の花の色
パラ嬢じゅの中野博

盛者必衰の理をあらわす
雄うしゃフィッシュ木ノ本パリオあラーク

おごれる人も久しからず
おごれ辻朋美さし烏

ただ春の夜の夢のごとし
山春野ココゆめのご吉

たけき者も ついには滅びぬ
名駅もの情意に名寄絹

偏(ひとえ)に風の前の塵に同じ
糸jessicaジェノヴァえのちVizioなじ


最後、「糸ジェシカジェノヴァえのちビジオなじ」がラスボスにふさわしい高難度だ。うまく「偏に風の前の塵に同じ」のリズムで読めるとサーフィンで荒波に乗っかったような達成感が得られるので(サーフィンやったことないけど)、ぜひこの部分だけでも一度チャレンジしてみてほしい。

暗号解読クイズ

せっかく暗号っぽくなったので、ここで暗号解読クイズを出題させてもらおう。有名なフレーズを、この駄洒落方式で暗号化しました。原文がわかるかな?

Q1.俳句です
!
Q2.これも俳句です
!
Q3.映画のタイトルです
!
Q4.本のタイトルです
!
「牙狼<GARO>」までで読みが「がろ」なので注意
Q5.超おもしろいウェブサイトの名前です
!
答えは来週後半あたりにtwitter:@dailyportalzにて発表します。それまで待てない!という人はこのページ右上のツイートボタンで情報交換してください。(クイズをダシに記事URLをtweetさせる作戦)

今後も精進します

本当はこの仕組みを自由に触ってもらえるようにWebサービスにできると良かったのだが、そうすると負荷が高すぎてすぐ落ちるか、万が一捌けたとしても僕の借りてるレンタルサーバに高額の請求が来そうだったので控えさせていただきました。恐縮でございます。

あとこれ作っている途中で知ったんだけど、こちらのページでも駄洒落っぽいフレーズの自動生成をやっていて、こちらは「最初の1~2音あってたらとにかく入れ替えちゃう」(たぶん)という荒々しいアプローチをしている。これはこれで面白いのでそのうち試して取り入れて(パクって)いきたい。

まだまだ自動駄洒落道にはやるべきことがいろいろあるのだ。

謝辞

単語辞書には「NAIST Japanese Dictionary」と「はてなダイアリーキーワードふりがなリスト」を使わせていただきました。開発者&関係者の皆様ありがとうございます。

最後に紹介したIT用語変換の作者はnegipoさんです。

▽デイリーポータルZトップへ

banner.jpg

 

デイリーポータルZのTwitterをフォローすると、あなたのタイムラインに「役には立たないけどなんかいい情報」がとどきます!

→→→  ←←←

 

デイリーポータルZは、Amazonアソシエイト・プログラムに参加しています。

デイリーポータルZを

 

バックナンバー

バックナンバー

▲デイリーポータルZトップへ バックナンバーいちらんへ