研究よりもhackしていたタイプの人間です。
Dコースに在籍しながら某社に勤務中。
しかし会社で書いているコードは研究みたいなコードという不思議な生態。
- 興味
- 自然言語処理
- (広義の)人工知能
- 美しくて分かりやすいhack
- 趣味&特技
- プログラミング:Lisp8割、Ruby1割、R1割といった感じ
- 空手:全日本空手道連盟公認2段
- ピアノ:ベートーヴェンの3大ソナタを弾いたことがある程度
- 趣味
- 水泳
- (デジタル)ゲーム(主にローグライク)
- アニメ
櫻井研を選んだ理由
- Lispでプログラムしたかったので
- 自由な研究をしようという風土なので
卒業論文のテーマ
書籍の推薦
読書のスタイルは、今確実に変化しようとしているのです!
読書に耐えうるPDAの開発、実用化迫る電子ペーパー、視覚障害者のための読み上げソフト、などなど。
加えて、書籍を手に入れる方法も多様化しています。
インターネット本屋サイト、電子図書館の充実、そしてGoogle Booksの登場…。
このような環境の変化の中で、かつて本屋さんや図書館であった「本との出会い」を確保していけるのか。
そのために、電子化された書籍データを見ることで、内容を考慮し書籍を推薦する方法について研究しています。
というのはお題目ですが。
書籍を解析したり分類したりする分野の中でも、数学的なモデルをユーザーの嗜好のような曖昧な基準でも適用できる方法を考えています。
修士論文のテーマ
半教師学習による専門用語認識
正解データをたくさん集めてそれを使って「学習」することをやるのが「機械学習」なのですが。
論文などに使われるいわゆる「テクニカルターム」を見つけるプログラムを作るには、特殊な知識を持つ人が頑張ってそういうデータを整備しなくちゃいけません。
それをなるべく少なくて済むようにしよう!というのがこの研究の方針です。
テクニカルには、ノンパラメトリックベイズというアプローチを使った言語モデルを構築することでこれを達成しています。
実装を公開しようかな、と思いながらずるずると来ていて一生このままのような気がします。
現在の研究テーマ
ノンパラメトリックベイズ全般
修士論文で使ってからこの分野にすっかりハマってしまい論文を読み漁っては実装しまくっている日々です。
修士論文の結果を発展させるもよし、別の応用を考えるのもよし、という妄想は広がります。
その他
データ解析コンペティション
興味があるから出てみたけど、難しかったです。
うっかり賞をいただけましたが、かなりふがいなかったと思います。
Lispスタイルプログラミングについて(特にマクロについて)
Lispは現存するプログラミング言語の中で2番目に古い言語です(1番古いのはFortran)。
しかしLispには黎明期から含まれていて、未だに最近の流行言語に(ほぼ)含まれて居ない機能があります。
それが、「マクロによるメタプログラミング」です。
その強力さ故、Lispには熱狂的なファンが存在しますが(含む私)、独特の構文のために毛嫌いされることも多いです。
で、この辺のいいとこどりをする方法がないかなー、と日々考えています。
などと考えていたら、RubyでCommon Lisp処理系を書いていました。
試しにここで公開してみます。