Получить текущий хэш git в скрипте Python

165

Я хотел бы включить текущий хэш git в вывод скрипта Python (как номер версии кода, который генерировал этот вывод).

Как я могу получить доступ к текущему git-хешу в моем скрипте Python?

Виктор
источник
7
Начните с git rev-parse HEADкомандной строки. Синтаксис вывода должен быть очевидным.
Мел Николсон

Ответы:

97

Команда git describe- это хороший способ создания презентабельного «номера версии» кода. Из примеров в документации:

С чем-то вроде текущего дерева git.git я получаю:

[torvalds@g5 git]$ git describe parent
v1.0.4-14-g2414721

то есть текущий заголовок моей «родительской» ветви основан на v1.0.4, но так как он имеет несколько коммитов, к ним добавлено число дополнительных коммитов («14») и сокращенное имя объекта для фиксации. сам ("2414721") в конце.

Из Python вы можете сделать что-то вроде следующего:

import subprocess
label = subprocess.check_output(["git", "describe"]).strip()
Грег Хьюгилл
источник
3
Это имеет тот недостаток, что код печати версии будет нарушен, если код будет запущен без git-репозитория. Например, в производстве. :)
JosefAssad
5
@JosefAssad: Если вам нужен идентификатор версии в рабочей среде, тогда ваша процедура развертывания должна запускать вышеуказанный код, и результат должен быть «внедрен» в код, развернутый в рабочей среде.
Грег Хьюгилл
15
Обратите внимание, что git fatal: No names found, cannot describe anything.
description
41
git describe --alwaysбудет возвращаться к последнему коммиту, если теги не найдены
Leonardo
5
@CharlieParker: git describeобычно требуется хотя бы один тег. Если у вас нет тегов, используйте --alwaysопцию. Смотрите документацию git description для получения дополнительной информации.
Грег Хьюгилл
190

Не нужно взламывать получение данных от gitкоманды самостоятельно. GitPython - это очень хороший способ сделать это и многое другое git. У него даже есть поддержка "наилучшего усилия" для Windows.

После pip install gitpythonтого, как вы можете сделать

import git
repo = git.Repo(search_parent_directories=True)
sha = repo.head.object.hexsha
kqw
источник
9
@crishoj Не знаю , как можно назвать портативным , когда это произойдет: ImportError: No module named gitpython. Вы не можете полагаться на то, что конечный пользователь gitpythonустановил его, и требование того, чтобы он установил его до того, как ваш код заработает, сделает его не переносимым. Если вы не собираетесь включать протоколы автоматической установки, с этого момента это уже не является чистым решением.
user5359531
39
@ user5359531 Прошу отличаться. GitPython предоставляет чистую реализацию Python, абстрагируясь от специфических для платформы деталей, и его можно установить с помощью стандартных инструментов пакета ( pip/ requirements.txt) на всех платформах. Что не "чисто"?
crishoj
22
Это нормальный способ делать вещи в Python. Если ОП нуждается в этих требованиях, они бы так и сказали. Мы не читатели мыслей, мы не можем предсказать каждую возможность в каждом вопросе. Так лежит безумие.
OldTinfoil
14
@ user5359531, мне непонятно, почему import numpy as npможно предположить, что такое весь стекопоток, но установка gitpython выходит за рамки «чистого» и «портативного». Я думаю, что это, безусловно, лучшее решение, потому что оно не изобретает колесо, скрывает уродливую реализацию и не пытается взломать ответ git из подпроцесса.
Jblasco
7
@ user5359531 Хотя я в целом согласен с тем, что не следует бросать блестящую новую библиотеку на каждую небольшую проблему, ваше определение «переносимости», похоже, игнорирует современные сценарии, когда разработчики имеют полный контроль над всеми средами, в которых работают приложения. В 2018 году мы Контейнеры Docker, виртуальные среды и образы машин (например, AMI) с pipвозможностью простой установки pip. В этих современных сценариях pipрешение столь же переносимо, как и решение «стандартной библиотеки».
Райан
106

Этот пост содержит команду, а ответ Грега содержит команду подпроцесса.

import subprocess

def get_git_revision_hash():
    return subprocess.check_output(['git', 'rev-parse', 'HEAD'])

def get_git_revision_short_hash():
    return subprocess.check_output(['git', 'rev-parse', '--short', 'HEAD'])
Юджи "Томита" Томита
источник
32
Добавьте полоску () к результату, чтобы получить это без разрывов строк :)
кузнечик
Как бы вы запустили это для git-репо по определенному пути?
pkamb
2
@pkamb Используйте os.chdir, чтобы перейти на путь к git-репо, с которым вам интересно работать
Zac Crites,
Разве это не дало бы неправильный ответ, если текущая проверенная ревизия не является главой филиала?
максимум
7
Добавьте a .decode('ascii').strip()для декодирования двоичной строки (и удалите разрыв строки).
пфм
13

numpyимеет симпатичный мультиплатформенную рутину в своем setup.py:

import os
import subprocess

# Return the git revision as a string
def git_version():
    def _minimal_ext_cmd(cmd):
        # construct minimal environment
        env = {}
        for k in ['SYSTEMROOT', 'PATH']:
            v = os.environ.get(k)
            if v is not None:
                env[k] = v
        # LANGUAGE is used on win32
        env['LANGUAGE'] = 'C'
        env['LANG'] = 'C'
        env['LC_ALL'] = 'C'
        out = subprocess.Popen(cmd, stdout = subprocess.PIPE, env=env).communicate()[0]
        return out

    try:
        out = _minimal_ext_cmd(['git', 'rev-parse', 'HEAD'])
        GIT_REVISION = out.strip().decode('ascii')
    except OSError:
        GIT_REVISION = "Unknown"

    return GIT_REVISION
ryanjdillon
источник
2
Мне нравится это, довольно чистый и без внешних библиотек
13aal
Ответ Юджи дает аналогичное решение только в одной строке кода, которая дает тот же результат. Можете ли вы объяснить, почему numpyсчел необходимым «построить минимальную среду»? (при условии, что у них были веские причины)
MD004
Я просто заметил это в своем репо и решил добавить его в этот вопрос для интересующихся людей. Я не занимаюсь разработкой в ​​Windows, поэтому я не проверял это, но я предполагал, что настройка envdict была необходима для кросс-платформенной функциональности. Ответ Юджи - нет, но, возможно, это работает как в UNIX, так и в Windows.
ryanjdillon
Глядя на вину git, они сделали это как исправление ошибки для SVN 11 лет назад: github.com/numpy/numpy/commit/… Возможно, исправление ошибки больше не нужно для git.
родитель
@ MD004 @ryanjdillon Они устанавливают локаль так, чтобы она работала, .decode('ascii')иначе кодировка неизвестна.
z0r
7

Если подпроцесс не переносим и вы не хотите устанавливать пакет, чтобы сделать что-то такое простое, вы также можете сделать это.

import pathlib

def get_git_revision(base_path):
    git_dir = pathlib.Path(base_path) / '.git'
    with (git_dir / 'HEAD').open('r') as head:
        ref = head.readline().split(' ')[-1].strip()

    with (git_dir / ref).open('r') as git_hash:
        return git_hash.readline().strip()

Я только протестировал это на своих репозиториях, но, похоже, работает довольно стабильно.

kagronick
источник
Иногда / refs / не найден, но текущий идентификатор фиксации находится в "pack-refs".
am9417
7

Вот более полная версия ответа Грега :

import subprocess
print(subprocess.check_output(["git", "describe", "--always"]).strip().decode())

Или, если скрипт вызывается из-за пределов репо:

import subprocess, os
os.chdir(os.path.dirname(__file__))
print(subprocess.check_output(["git", "describe", "--always"]).strip().decode())
AndyP
источник
1
Вместо того , чтобы использовать os.chdir, то cwd=аргумент может быть использован в check_outputвременные изменения в рабочем каталоге перед выполнением.
Марк
0

Если по какой-то причине у вас нет git, но у вас есть git-репозиторий (найдена папка .git), вы можете получить хеш коммита из .git / fetch /heads / [branch]

Например, я использовал следующий быстрый и грязный фрагмент Python, запускаемый в корне хранилища, чтобы получить идентификатор фиксации:

git_head = '.git\\HEAD'

# Open .git\HEAD file:
with open(git_head, 'r') as git_head_file:
    # Contains e.g. ref: ref/heads/master if on "master"
    git_head_data = str(git_head_file.read())

# Open the correct file in .git\ref\heads\[branch]
git_head_ref = '.git\\%s' % git_head_data.split(' ')[1].replace('/', '\\').strip()

# Get the commit hash ([:7] used to get "--short")
with open(git_head_ref, 'r') as git_head_ref_file:
    commit_id = git_head_ref_file.read().strip()[:7]
am9417
источник