2011年11月18日金曜日

LaTeX for HPSG

HPSG関係で使いそうな記号とかその他。

パッケージ

avm.sty
AVM(Attribute-Value Matrix)を書くためによく使われるマクロらしい。
木構造の中にAVMを埋め込みたいが、木構造マクロと組み合わせるとうまく動かない、という場合は\setboxとか\boxとか使うとうまく行くかも知れない。例えばtreeprintと組み合わせる場合。
¥setbox0=¥hbox{
  ¥begin{avm}[¥asort{word}HEAD&¥ajKaku1¥¥VAL&itr]¥end{avm}
}
¥tree{¥box0}
  ¥leaf{fish}
¥endtree

演算子・括弧など

\preceq
\succeq
\wedge
\vee
\Rightarrow
¬\neg
\top
\bot
〈〉\langle \rangle
{}\{ \}

角囲み数字

プリアンブルで\usepackage{otf}として、本文中で\ajKaku{1}のようにする(0〜100)。

二重角括弧

二重角括弧[[]]は、\usepackage{txfonts}(またはpxfonts)して\llbracket \rrbracketか、\usepackage{textcomp}して\textlbrackdbl \textrbrackdblで書ける。

二重山括弧

二重山括弧《》は、\usepackage{MnSymbol}して\llangle \rrangleで書ける。だがどうもtxfontsやpxfontsとの相性が悪いらしい。全角の 《》をそのまま使ってもいいが、$\left《 ... \right》$みたいな使い方はできない。

2011年11月1日火曜日

nokogiriのインストール on Lion

Lionでruby1.9とnokogiriを使うメモ。

1. ruby1.9をインストールする。

以前のエントリとかよそのサイトとか参照。

2. nokogiriをインストールする。

gem install nokogiri

rubyのインストールさえちゃんとできてればnokogiriのインストールはあっさり終わると思われる。

京都大学テキストコーパス on Lion

Lionで京都大学テキストコーパス4.0をセットアップするメモ。

1. 京都大学テキストコーパスをセットアップ

以前、別の場所で書いたWindows環境でのセットアップと大体同じ方法でいけた。MacなのでCygwinのインストールは不要。perlスクリプトの修正は必要。フォルダは$HOME/KyotoCorpus4.0とか適当に。

http://www.mizimada.net/notes/kyotocorpus/install.html

Last Update: 2011.08.11
インストールには、perl、京大コーパス、毎日新聞データが必要。
Windows環境&最新のperlだとインストール用スクリプトの一部が正しく動かない場合があるので修正が必要。
  1. Cygwinをインストールする
    ダウンロードサイトの選択(choose a download site)
    ftp://ring.aist.go.jp とか適当に
    パッケージの選択(choose packages)
    perlを追加する
    インストールが完了したら、Cygwin Bash Shellを一度起動しておく(初期設定のため)
  2. 京都大学テキストコーパスの準備
    kyotocorpus4.0.tar.gzを解凍して、kyotocorpus4.0フォルダを
    c:\cygwin\home\(username)\KyotoCorpus4.0
    あたりに置く
  3. 毎日新聞データの準備
    mai95.txtを
    c:\cygwin\home\(username)\KyotoCorpus4.0\mai95.txt
    あたりに置く。
    ファイル名がmai1995.txt(最近の版?)になっている場合はmai95.txtにリネームする。
  4. インストール用スクリプトの修正(重要)
    c:\cygwin\home\(username)\KyotoCorpus4.0\src
    にある
    format.pl 
    num2KNP.pl
    の二つのファイルをテキストエディタで開いて
    use open IO => ':encoding(euc-jp)';
    の次の行に
    use open ":std"; 
    と書き加える。
  5. インストールの実行
    Cygwin Bash Shellを起動し、以下のように入力。
    $ cd KyotoCorpus4.0
    $ ./auto_conv -d .


2. XMLファイルに変換

以前作ったXML変換スクリプトで行けた。ここからkc2xml.rbを取得してKyotoCorpus4.0フォルダに置き、ターミナルでKyotoCorpus4.0フォルダに移動して以下のように実行。要ruby1.9。

ruby kc2xml.rb -s ./dat/syn -t ./xml/syn -u
ruby kc2xml.rb -s ./dat/rel -t ./xml/rel -u

ただし、あらかじめ出力先フォルダ(KyotoCorpus4.0/xml/synとKyotoCorpus4.0/xml/rel)を作っておかないとうまく動かない。無ければ勝手に作るように書いたつもりだったのだが、いろいろいじってるうちにミスったっぽい。そのうち直そう。