ラベル Mac の投稿を表示しています。 すべての投稿を表示
ラベル Mac の投稿を表示しています。 すべての投稿を表示

2011年11月1日火曜日

京都大学テキストコーパス on Lion

Lionで京都大学テキストコーパス4.0をセットアップするメモ。

1. 京都大学テキストコーパスをセットアップ

以前、別の場所で書いたWindows環境でのセットアップと大体同じ方法でいけた。MacなのでCygwinのインストールは不要。perlスクリプトの修正は必要。フォルダは$HOME/KyotoCorpus4.0とか適当に。

http://www.mizimada.net/notes/kyotocorpus/install.html

Last Update: 2011.08.11
インストールには、perl、京大コーパス、毎日新聞データが必要。
Windows環境&最新のperlだとインストール用スクリプトの一部が正しく動かない場合があるので修正が必要。
  1. Cygwinをインストールする
    ダウンロードサイトの選択(choose a download site)
    ftp://ring.aist.go.jp とか適当に
    パッケージの選択(choose packages)
    perlを追加する
    インストールが完了したら、Cygwin Bash Shellを一度起動しておく(初期設定のため)
  2. 京都大学テキストコーパスの準備
    kyotocorpus4.0.tar.gzを解凍して、kyotocorpus4.0フォルダを
    c:\cygwin\home\(username)\KyotoCorpus4.0
    あたりに置く
  3. 毎日新聞データの準備
    mai95.txtを
    c:\cygwin\home\(username)\KyotoCorpus4.0\mai95.txt
    あたりに置く。
    ファイル名がmai1995.txt(最近の版?)になっている場合はmai95.txtにリネームする。
  4. インストール用スクリプトの修正(重要)
    c:\cygwin\home\(username)\KyotoCorpus4.0\src
    にある
    format.pl 
    num2KNP.pl
    の二つのファイルをテキストエディタで開いて
    use open IO => ':encoding(euc-jp)';
    の次の行に
    use open ":std"; 
    と書き加える。
  5. インストールの実行
    Cygwin Bash Shellを起動し、以下のように入力。
    $ cd KyotoCorpus4.0
    $ ./auto_conv -d .


2. XMLファイルに変換

以前作ったXML変換スクリプトで行けた。ここからkc2xml.rbを取得してKyotoCorpus4.0フォルダに置き、ターミナルでKyotoCorpus4.0フォルダに移動して以下のように実行。要ruby1.9。

ruby kc2xml.rb -s ./dat/syn -t ./xml/syn -u
ruby kc2xml.rb -s ./dat/rel -t ./xml/rel -u

ただし、あらかじめ出力先フォルダ(KyotoCorpus4.0/xml/synとKyotoCorpus4.0/xml/rel)を作っておかないとうまく動かない。無ければ勝手に作るように書いたつもりだったのだが、いろいろいじってるうちにミスったっぽい。そのうち直そう。

2011年10月31日月曜日

TeXの環境設定 on Lion

主にここを参照。
http://oku.edu.mie-u.ac.jp/~okumura/texwiki/?Mac

1. MacTeX-2011をダウンロードしてきてインストール

2. Additional Tools for MacTeX/TeX Live 2011をダウンロードしてきて適用

3. TeXShopとLaTeXiTの環境設定(ここ参照)
LaTeXiTのプリアンプルをjsarticleにするの忘れてちょっと嵌った。
あとTeXShopのbibtexをpbibtexにするのも。

4. よく使うパッケージのインストール
gb4e ... 例文番号振ったりグロス書いたりする奴。
jecon ... 日本語経済学論文用の参考文献スタイル。言語学用に近い。

/usr/local/texlive/texmf-local/tex/latex/local
/usr/local/texlive/texmf-local/bibtex/bst/local
あたりにフォルダごとコピーして、ターミナルからsudo mktexlsrする。

jeconの今日現在のバージョンは2.7。このスタイルは、日本語著者名については「姓 名」のフォーマットでbibファイルに記述されていることを前提としているらしく、英語と同じように「姓, 名」のフォーマットで記述してあるとかえって「名姓」の順にひっくり返して出力してしまうらしい。なので、jecon.bstをちょっといじる。

[1498-1499行]
            { s nameptr "{ll}" format.name$ 'ss :=
              s nameptr "{ff}" format.name$ 'tt :=

[3252, 3254行]
              { s nameptr "{ll}" format.name$ 't :=
                  { s #1 "{ff}" format.name$ 't := }

他にもいじる必要がありそうだが、見つけたらまた直すということで。

2011年10月29日土曜日

MBA事始め

MBA導入したのでいろいろメモ。

1. キーバインド等

Winと比べると、CtrlではなくCommandキー使うという点以外は、主要なショートカットキーはMacでも同じらしい。全て選択とかコピーとかペーストとか保存とか。
IMEはスペースキーの左右にある英数キーとかなキーで単純に切り替え可能な模様。とりあえずことえりを使っているが、Google IMEというのも評判が良いそうなのでそのうち試してみたい。

2. トラックパッド

パッド下部がクリックエリアになっているようだが、タップでクリックするように設定した方がうるさくなくてよさそう。Winの右クリック(コンテキストメニューとか)は二本指タップ。画面のスクロールやブラウザの進む、戻るは二本指スワイプ。さらに三本指スワイプで、Mission ControlやExposéなどアプリケーション切り替え関係の機能が使える模様(便利そう)。
ドラッグは三本指でやる方法と、ダブルクリックでやる方法があるようだが、前者を取ると前述のアプリケーション切り替えが四本指になってしまってちょっとやりにくいので、後者にすることにした。前者はシステム環境設定のトラックパッドで、後者はユニバーサルアクセスで設定することができる(なんで分かれてるんだろ)。

3. ソフトウェアのインストール

ソフトウェアのインストールの仕方は多分二通りで、一つはAppStoreで購入するという方法、もう一つはパッケージ版のソフトを買ったりダウンロードしてきたりして自分でインストールする方法。OSに最初からAppStoreのアプリがついていて、そこから無数のソフトをインストールしたりアップデートしたりすることができるのは便利だと思う。
自分でインストールする場合は、Winとの違いにちょっと戸惑うかも知れない。Winだとほとんどのソフトはインストーラー付きのパッケージで配布されていて、むしろインストーラーなしのソフトをアプリケーションフォルダに放り込むことに抵抗を感じるくらいだが、Macではアプリケーションフォルダに放り込むだけのソフトが結構あるみたい。アンインストールも、Winだとコントロールパネルで全て管理するが、Macはごみ箱に放り込むだけ。ただし関連ファイルが削除されなかったりするらしいので、AppCleanerみたいな関連ソフトも自動で探してくれるソフトを入れておいた方がいいらしい。

4. iWork

iWorkはパッケージで買うか、AppStoreで購入することができる。私はMBA購入と同時にパッケージで買ってしまったが、これだとAppStoreの方が購入済みにならないのでちょっと気持ち悪い。パッケージではなくAppStoreで買った方がいいかも知れない。
ちょっと使った感じだと、KeyNoteは噂に聞く通りいい感じ。特にスライドからスライドへ移るときの効果(トランジション)がすごくいい。画像の背景を削除するアルファという機能もお目当ての一つだったのだが、実はこれは最近のPowerPointにもついているらしい(今更知った・・・)。アルファ機能については、むしろパワポの方が使いやすいか?KeyNoteはなかなか思う通りに切り取れん。
Office for Macは今回買わなかったが、そのうち買うかも知れない。

5. セキュリティソフト

とりあえずSophosとかいうのを入れておいた。

6. ブラウザ

Safariでもいいのだが、使い慣れているChromeで。拡張機能は、とりあえず地震速報だけ入れといた。

7. TeX

WinだとTeXインストーラー3というのがあって全部おまかせで行けるのだが、MacだとMacTeXというのがいいらしいのでそれを入れた。さらに日本語環境用の各種設定をしてくれるというAdditional Toolsなるものを入れる。問題はTeXShopやら何やらの諸設定で、WinにせよMacにせよ各ソフトがちゃんと動くようにするための設定がとても面倒くさいように思う。こちとらtexとかplatexとかpdftexとかdvipsとかdvipdfmxとかの違いもまともに理解していないので何を設定すればいいのか解説サイトとか見ても分からん。とりあえずTeXShopは普通に日本語入りUTF-8文書をちゃんと処理してくれるようになった。LaTeXiTはまだ言うことを聞いてくれない(日本語が表示されない)。TeXworksは気が向いたらそのうち。

8. Ruby

Rubyは1.8.7が最初から入っているようだが、1.9.2を入れておいた方がよかろうと思いインストールを試みる。いくつかLionにRuby1.9を入れる方法を解説してくれるサイトがあったので、それらを見ながらインストールする。面倒くさかった点の一つは、AppStoreからインストールできるXcodeの最新版(4.2)ではなく、4.1でなくてはうまく行かないということ。わざわざ4.2をアンインストールして4.1探してきて入れる羽目になった。手順はだいたい以下の通りだったと思うが、ごちゃごちゃいじったので違うところもあるかも。

i. Xcode 4.1をインストール
ii. homebrewとやらをインストール
iii. brewを使ってgitやらreadlineやらopensslやらをインストール
iv. rvmをインストール
v. ~/.bash_profileに次のようなことを書き込む。
[[ -s "$HOME/.rvm/scripts/rvm" ]] && . "$HOME/.rvm/scripts/rvm" # Load RVM function
export CC=/usr/bin/gcc-4.2
vi. ターミナルを再起動してrvmで1.9.2をインストールし、1.9.2に切り替える。

9. その他のソフトをインストール

RとかInkscapeとか。あとエディタが必要かと思ってmiというのを入れた。Inkscape動かすにはX11とやらが必要らしいのだが、X11が何なのかもあまり理解していない。

10. Appleマーク

日のあたる場所で画面を暗くして作業していると、筐体上面のAppleマークのところから光が入ってきて画面の中央に浮かび上がる。