Lead or Gold

なんかものすごいことを発見した気がする.発見したものをとりあえず何回も精査したものの,欠点が見当たらずほぼ完璧なもの.あまりに美しすぎるので,逆に「ぜーったいこれ,どこか見落としがあって間違ってるんだって」とか「いやいや,俺が発見できるく…

昔から「名前が必殺技っぽいなー」って思ってたんですよ

新年あけましておめでとうございます.

Input Method 飲み会

この世界に Double Array の実装詳細について熱く語り合うことができる飲み会が存在するとは思わなかった!!

ここの更新が SNS に反映されない

ここの更新って Local SNS には反映されないじゃん.まー,いっか.こそこそ更新.

input method 飲み会

usata くん経由で input method 飲み会なるものに誘われましたですよ? Anthy/uim 開発している田畑さんという方とお会いして, uim について色々話すことになったような.なんでも,最近 uim の内部が HMM から MEMM になったそうで,今後 CRFs にするかも…

論文積ん読

なんかK村くんに無言で論文を渡されてしまいましたよよよ? René Vidal, "Online Clustering of Moving Hyperplanes", NIPS 2006. これは読めということですね?……読む暇あるのか?>俺

Mixi は?

Mixi のほうはどうでしょうか?

論文積ん読

Nobuyuki Shimizu and Andrew Haas, "Exact Decoding for Jointly Labeling and Chunking Sequences", Proceedings of the COLING/ACL 2006 Main Conference Poster Sessions.

今日の論文

Koby Crammer and Yoram Singer, "Ultraconservative Online Algorithms for Multiclass Problems", COLT 2001. 4.1 の Theorem 1 は分離可能問題の場合のアルゴリズムの収束証明. Theorem 2 は分離不可能な問題の場合の収束証明. 恐らく Margin Infused R…

閉鎖的な場所に日記つけるのはもったいないお化けが出る

ブログ (日記) つける場所として Mixi とか local SNS とかあるけれど,せっかく日記つけるのに閉鎖的っつーのがもったいなくて嫌いなんだよにぇ.

多分3回目

このブログ再利用しようと試みるの何回目なんだよお前,ってゆ〜.

いま,はんぶん.もうはんぶん.

いま,はんぶん.もうはんぶん.

variance 1.0 (131) 0.97986/-/-/0.95826

Elapsed time: 81003[s] (869.326[s] in this iteration) Likelihood: 0.0129992 -> 0.0129968 (relative change: 0.000189496) Log likelihood: -101936 -> -101940 (relative change: 4.36298e-005) # of iterations: 95 Elapsed time: 81003 Elapsed time…

pine に独自に binutils を導入する

pine の ld はコマンドラインオプションが独自なので bjam が走らない.で, binutils を独自に導入しようとすると gmake の途中でこける.解決策. binutils のこんふぃぎゃーに --disable-nls オプションをつける. #user-config.jam の gcc.init に sun …

CRF Gaussian 2.0, (53)

RWCP 形態素解析実験結果

RWCP 学習 64%, 開発 16%, 評価 20% 全コーパス中に基本形が1回しか現れない単語を全て未知語として学習.ただし,学習時に対応する未知語処理が存在しない場合は既知語として学習,評価時は未知語として扱う(すなわち絶対に正解できない).単語未知語全展…

うがーっ!!実験やり直しーーっ!! っつーかこんな難しいことさせてたらそら MEMM で95%いかないなんて精度になるわな.ぶーぶーぶー.

昨日のまとめ その2

5文字未知語展開,前進 MEMM,Gaussian prior 付,収束条件1.0e-4の条件を揃えて,prior の variance と 素性の頻度のスレッショルドを変えた場合 1 2 3 4 5 6 7 8 9 10 0.5 0.6 0.7 0.94573 0.8 0.9 0.94251 1.0 0.94425 0.94391 0.94324 1.1 0.94244 1.2 0…

昨日のまとめ

5文字未知語展開,前進 MEMM,prior なし,1.0e-03の条件を揃えて,素性の回数のスレッショルドのみを変えた場合 3 4 5 6 7 0.92431 0.94657 0.95028 0.945688 0.94859

マシン elm モデルファイル elm 上 rwcp_memm_5_100_3_gaussian_007_3 学習 Likelihood: 0.00161736 -> 0.00162545 (relative change: 0.00500255) Log likelihood: -150847 -> -150730 (relative change: 0.000777033) # of iterations: 29 Elapsed time: 2…

マシン vine モデルファイル vine 上 rwcp_memm_5_100_6_3 学習 Likelihood: 0.00843418 -> 0.00841299 (relative change: 0.00251864) Log likelihood: -112085 -> -112144 (relative change: 0.000526751) # of iterations: 54 Elapsed time: 5159.95 Elap…

マシン fir (XEON 2.8G, 4.0GB, Gentoo Linux 2005.1) 素性 RWCP 標準設定 全コーパス中の出現頻度3回未満の素性を破棄 未知語処理 5文字未知語全展開 1回出現の単語を全て擬似未知語として学習 その他パラメータ 素性数: ユニークな単語数:18023 1回のみ…

RWCP 形態素解析実験結果(前進 MEMM)

マシン elm (XEON 2.8G, 4.0GB, Gentoo Linux 2005.1) 素性 RWCP 標準設定 全コーパス中の出現頻度3回未満の素性を破棄 未知語処理 5文字未知語全展開 1回出現の単語を全て擬似未知語として学習 その他パラメータ 素性数: ユニークな単語数:18023 1回のみ…

しっぱいしちゃった

なんか学習のイテレーションが異様に遅いプロセスが1個あると思ってたらオプション間違えてCRF学習させてた.めっ!

RWCP 形態素解析実験結果(Gaussian prior 付前進 MEMM)

マシン fir (XEON 2.8G, 4.0GB, Gentoo Linux 2005.1) 素性 RWCP 標準設定 全コーパス中の出現頻度3回未満の素性を破棄 未知語処理 5文字未知語全展開 1回出現の単語を全て擬似未知語として学習 その他パラメータ 素性数: ユニークな単語数:18023 1回のみ…

RWCP 形態素解析実験結果(前進 MEMM)

http://d.hatena.ne.jp/ai_azuma/20060416#1145178502 と同じ実験設定でマシンだけ変えたもの マシン elm モデルファイル elm 上 rwcp_memm_5_100_3_3 学習 Likelihood: 0.000430434 -> 0.000429505 (relative change: 0.00216254) Log likelihood: -181917 …

RWCP 形態素解析実験結果(Gaussian prior 付前進 MEMM)

http://d.hatena.ne.jp/ai_azuma/20060416#1145183826 と同等の実験設定でマシンだけ変えたもの マシン fir (XEON 2.8G x2 (Hyper Threading), 4.0GB, Gentoo Linux 2005.1) モデルファイル fir 上 rwcp_memm_5_100_3_gaussian_01_3 学習 Likelihood: 0.0020…

いったん commit

とりあえずこの状態でいったん commit して, Unix 系サーバでパラメータ変えて大量に回しましょう.