Gitの隅っこ – Tree-ishって何?


こんにちは、SJC共同推進室の北谷です。

ソフトウェア開発に携わっている皆さんは普段Gitを活用されていますか。Gitってたくさんのコマンドやオプションがあり、とても全部は把握しきれないので、その中で開発に必要な使い方を覚えて使うというスタイルかと思います。

しかし、ドキュメントを見ているとこれは何だろうと思うところはたくさんあります。この記事ではその一つだけ、取り上げてみます。実用として役に立つというほどの情報ではないですが、興味を持たれた方はお付き合いください。

Tree-ish

取り上げるのは”tree-ish” です。コマンドの引数として所々で出てきます。単語に “-ish” がつくと「…っぽい」というような意味になります。”Pink-ish” だと「ピンクがかった」みたいに。なので “tree-ish”は「ツリーっぽい」。そうだとするとディレクトリツリーかなって思いますよね。

一例として git checkout の SYNOPSIS (https://git-scm.com/docs/git-checkout) を見てみると以下のように、5番目、6番目の用法に tree-ish が現れています。あと、時々お世話になる git reset にも出てきます。

この5番目、6番目の機能の説明は次のようになっています

tree-ish にはほとんどの場合はコミットを示すものを指定するのだ、と書いてあります。しかし、ちょっと不思議です。そもそもなぜ “tree-ish” (ツリーのようなもの) といった言い回しをするのでしょうか。また、コミットでないものもあるのでしょうか。

まず見るべきはもちろん Git ドキュメントの用語集の中の “tree-ish” の説明でしょう。見てみると、次のように書いてあります (https://git-scm.com/docs/gitglossary/ja#def_tree-ish):

最初の文が定義のようですが、なんだか難しいですね。出てきている用語について一つ二つ見て行きましょう。

オブジェクト

実はオブジェクトは Gitの内部構造の基本です。いろんなところで説明されていますので、ここではざっくりとだけ触れますが、詳しくはこのあたりを参照していただければと思います。

ざっくりいうと、ファイルも、ディレクトリもリビジョンも、コミットも、タグもみんなオブジェクトの1種です。そして、それぞれに SHA IDがついていて、他のオブジェクトを参照しています。

上のサイトからの図を貼付します。

    

(出典:Pro Git book, https://git-scm.com/book/en/v2/Git-Internals-Git-Objects)

ひとつ目は、オブジェクトがファイルツリーを構成している図、二つ目はそれがコミットによって更新された状態の図です。この中のそれぞれの箱がオブジェクトです:

  • グレー:ファイルに相当するオブジェクト = blobオブジェクト
  • 緑:ディレクトリに相当するオブジェクト = ツリーオブジェクト
  • オレンジ:コミットに相当するオブジェクト = コミットオブジェクト

このように、オブジェクトは他のオブジェクトを参照していることがわかります。緑の四角がいわゆるツリーオブジェクトで、ディレクトリに相当するデータです。リビジョンが違うと同じディレクトリでも違うオブジェクトになります。

そして、Tree-ish のツリーはきっとこのツリーオブジェクトだなと見当がつきます。

参照外し

Tree-ish の説明に出てくるこの用語がひとつ混乱の元であるように思います。

英語では “dereference” です。同じく用語集を見てみます ( https://git-scm.com/docs/gitglossary/ja#def_dereference) と、残念ながら日本語訳はありません。

この説明を読むと、dereference は次のような意味にとれます:

  • シンボリック参照、タグオブジェクト、コミットオブジェクトから、(参照を辿って)それらが指すオブジェクトにアクセスすること

参照先のそのまた参照先といった具合に再帰的に辿ることがあり、その場合一つ参照を辿るごとに残りの参照が減っていくので、「dereference=参照外し」と呼ぶのではないかと思います。

Tree-ish

では本題の Tree-ish に戻ります。

tree-ish の説明の原文 ( https://git-scm.com/docs/gitglossary#def_tree-ish) に戻ってみます。最初の1文:

  • A tree object or an object that can be recursively dereferenced to a tree object.

結局これが tree-ish の説明なのですが、上記で見てきた内容を踏まえて少し簡略化して訳すとこんな感じにできるかと思います:

  • tree-ish は参照を辿ることでツリーオブジェクトを得られるオブジェクトのこと

そして tree-ish を引数に取る git コマンドは、その tree-ish からツリーオブジェクトまで辿って、そのツリーオブジェクトを処理の対象にします。コミットIDもその1例である、と解釈しました。

これで、もやもや感も解消した気がします。

ちなみに、実際に tree-ish に指定できるものは、以下のものがあるそうです (commit-ish も一緒に書いてあります):

出典: https://stackoverflow.com/questions/4044368/what-does-tree-ish-mean-in-git

おわりに

調べる過程で学んだオブジェクトについては、Git をもう1段理解するためには必要な知識でした。Tree-ish はたまたま目について取り上げましたがかなり重箱の隅的なトピックではあります。次はもうちょっと使える部分を掘ってみたいと思います。

以上、長くなりましたがお付き合いありがとうございました。