JGit是一个由Eclipse基金会开发、用于操作git的纯Java库。它本身也是Eclispe的一部分,实际上Eclipse的插件EGit便是基于JGit的。如果你像我这样有使用代码来操作git的需求,那就准备好拥抱JGit吧。目前来看别的竞品没它靠谱。
概念
从用户指南的概念一节中可以看到,JGit的基本概念如下:
- Git对象(Git Objects):就是git的对象。它们在git中用SHA-1来表示。在JGit中用
AnyObjectId
和ObjectId
表示。而它又包含了四种类型:
- 二进制大对象(blob):文件数据
- 树(tree):指向其它的tree和blob
- 提交(commit):指向某一棵tree
- 标签(tag):把一个commit标记为一个标签
- 引用(Ref):对某一个git对象的引用。
- 仓库(Repository):顾名思义,就是用于存储所有git对象和Ref的仓库。
- RevWalk:该类用于从commit的关系图(graph)中遍历commit。晦涩难懂?看到范例就清楚了。
- RevCommit:表示一个git的commit
- RevTag:表示一个git的tag
- RevTree:表示一个git的tree
- TreeWalk:类似RevWalk,但是用于遍历一棵tree
准备环境
让我们从一个最典型的用例开始吧。首先在/tmp/jgit/repo
中创建一个git仓库:
1 2 3
| mkdir -p /tmp/jgit/repo cd /tmp/jgit/repo git init --bare
|
再创建一个clone该仓库的客户端:
1 2 3
| cd /tmp/jgit/ git clone repo client cd client
|
输入git status
应该能够看到Initial commit,这样环境就没有问题了。然后提交一个文件,给仓库里来点库存:
1 2 3 4
| echo hello > hello.txt git add hello.txt git commit -m "hello" git push
|
动手
获取仓库
动手时间。新建Maven工程,往pom.xml中增加dependency,最后的pom.xml看起来就像这样:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
| <?xml version="1.0" encoding="UTF-8"?> <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd"> <modelVersion>4.0.0</modelVersion> <groupId>org.ggg.jgit</groupId> <artifactId>helloJgit</artifactId> <version>1.0-SNAPSHOT</version> <dependencies> <dependency> <groupId>org.eclipse.jgit</groupId> <artifactId>org.eclipse.jgit</artifactId> <version>4.8.0.201706111038-r</version> </dependency> </dependencies> </project>
|
让我们先尝试clone一下这个仓库。因为client分为已经存在以及重新clone的两种,所以我们在src/main/java中新增一个RepositoryProvider
接口,用两种不同实现以示区分:
1 2 3
| public interface RepositoryProvider { Repository get() throws Exception; }
|
并实现之:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22
| public class RepositoryProviderCloneImpl implements RepositoryProvider { private String repoPath; private String clientPath; public RepositoryProviderCloneImpl(String repoPath, String clientPath) { this.repoPath = repoPath; this.clientPath = clientPath; } @Override public Repository get() throws Exception { File client = new File(clientPath); client.mkdir(); try (Git result = Git.cloneRepository() .setURI(repoPath) .setDirectory(client) .call()) { return result.getRepository(); } } }
|
新增一个HelloJGit
主程序类:
1 2 3 4 5 6 7 8 9 10
| public class HelloJGit { private static RepositoryProvider repoProvider = new RepositoryProviderCloneImpl("/tmp/jgit/repo", "/tmp/jgit/clientJava"); public static void main(String[] args) throws Exception { try (Git git = new Git(repoProvider.get())) { git.pull().call(); } } }
|
直接运行HelloJGit
的main
函数,ls /tmp/jgit/
应该就能看到新clone出来的clientJava
文件夹了。
1 2 3
| cd /tmp/jgit/clientJava ls git status
|
我们当然不希望总是在使用的时候才重新clone一个仓库,因为当仓库很大的时候可能会非常耗时。让我们在client
中再提交一个commit:
1 2 3 4
| echo hello2 > hello2.txt git add hello2.txt git commit -m "hello again" git push
|
然后尝试直接从刚刚clone下来的clientJava中创建Repository:
1 2 3 4 5 6 7 8 9 10 11 12 13 14
| public class RepositoryProviderExistingClientImpl implements RepositoryProvider { private String clientPath; public RepositoryProviderExistingClientImpl(String clientPath) { this.clientPath = clientPath; } @Override public Repository get() throws Exception { try (Repository repo = new FileRepository(clientPath)) { return repo; } } }
|
然后把HelloJGit
的repoProvider
实例替换为RepositoryProviderExistingClientImpl
:
1
| private static RepositoryProvider repoProvider = new RepositoryProviderExistingClientImpl("/tmp/jgit/clientJava/.git");
|
注意这次的路径中需要加上.git
才行。再次运行HelloJGit
的main
函数,便可以通过ls /tmp/jgit/clientJava
看到新提交的hello2.txt
文件了。
常用操作
接下来尝试git add
、git commit
和git push
这几个最常用的命令。让我们往clientJava
中添加一个hello3.txt
文件并提交。如下修改HelloJGit
:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23
| public static void main(String[] args) throws Exception { try (Repository repo = repoProvider.get(); Git git = new Git(repo)) { createFileFromGitRoot(repo, "hello3.txt", "hello3"); git.add() .addFilepattern("hello3.txt") .call(); git.commit() .setMessage("hello3") .call(); git.push() .call(); } } private static void createFileFromGitRoot(Repository repo, String filename, String content) throws FileNotFoundException { File hello3 = new File(repo.getDirectory().getParent(), filename); try (PrintWriter out = new PrintWriter(hello3)) { out.println(content); } }
|
虽然操作多了,但是有了Repository
和Git
对象之后,看起来它们的实现都非常直观。运行main
函数之后,可以到client
文件夹中校验一下:
1 2 3 4
| cd /tmp/jgit/client git pull cat hello3.txt git log
|
在我的机器上运行git log
,可以得到:commit 7841b8b80a77918f2ec45bcedb934e2723b16b5c (HEAD -> master, origin/master),以及另外两个commit。有兴趣的读者们可以自行尝试其它的git命令。
其它对象
虽然上面两小节的内容对于普通需求来说已经大致上够用了,但是在概念一节中介绍到的其它概念,如Git对象、引用等还没有出场呢。我们再新建一个WalkJGit
的类,在main
函数中编写如下代码:
1 2 3 4 5
| try (Repository repo = repoProvider.get()) { Ref ref = repo.getAllRefs().get(Constants.HEAD); ObjectId objectId = ref.getObjectId(); System.out.println(objectId); }
|
这回,Ref
和ObjectId
都出现了。在我的机器上,运行以上程序打印出来了AnyObjectId[7841b8b80a77918f2ec45bcedb934e2723b16b5c]。我们可以看到,取得HEAD
的Ref
,其ObjectId
其实就是在client
文件夹中运行git log
之后结果。除了HEAD
以外,repo.getAllRefs()
返回的Map
实例中还有refs/heads/master
和refs/remotes/origin/master
,在目前的情况下,它们的ObjectId
完全相同。那么如何获取其它的commit呢?那就是RevWalk
出场的时候。把main
函数中的内容替换为如下代码:
1 2 3 4 5 6 7 8 9
| try (Repository repo = repoProvider.get()) { Ref ref = repo.getAllRefs().get(Constants.HEAD); try (RevWalk revWalk = new RevWalk(repo)) { RevCommit lastCommit = revWalk.parseCommit(ref.getObjectId()); revWalk.markStart(lastCommit); revWalk.forEach(System.out::println); } }
|
可以看到RevWalk
本身是实现了Iterable
接口的。通过对该对象进行循环,就可以获取所有的commit的RevCommit
对象。可以到client
文件夹确认一下,这些SHA-1字符串应该跟刚才git log
命令的结果相同。RevCommit
对象本身含有这个commit的所有信息,所以可以如下打印出来:
1 2 3 4 5 6
| revWalk.forEach(c -> { System.out.println("commit " + c.getName()); System.out.printf("Author: %s <%s>\n", c.getAuthorIdent().getName(), c.getAuthorIdent().getEmailAddress()); System.out.println("Date: " + LocalDateTime.ofEpochSecond(c.getCommitTime(), 0, ZoneOffset.UTC)); System.out.println("\t" + c.getShortMessage() + "\n"); });
|
这样看起来是不是很有git log
的感觉呢?需要注意的是,RevWalk
线程不安全,并且像Stream
那样,只能使用一次。如果想要再来一次,就需要重新创建RevWalk
对象或是调用其reset
方法(还得重新markStart
!)。
要想看到每个commit中有什么内容,那就需要用到TreeWalk
了,它的思路和RevWalk
类似。尝试如下代码:
1 2 3 4 5 6 7 8 9 10 11 12 13
| for (RevCommit commit : revWalk) { System.out.println("\ncommit: " + commit.getName()); try (TreeWalk treeWalk = new TreeWalk(repo)) { treeWalk.addTree(commit.getTree()); treeWalk.setRecursive(true); while (treeWalk.next()) { System.out.println("filename: " + treeWalk.getPathString()); ObjectId objectId = treeWalk.getObjectId(0); ObjectLoader loader = repo.open(objectId); loader.copyTo(System.out); } } }
|
这样便可以显示仓库在每个commit时候的状态了。如果需要diff,那么还将需要用到DiffEntry
等类,本文就不再赘述了,有兴趣的读者可以参考这个类。
最后将环境还原:
参考资料
这个代码库里有很全面的、基本可以直接用于生产环境的范例。
JGit的源码和用户指南。