Двоичные данные в MySQL [закрыто]

186

Как хранить двоичные данные в MySQL ?

Джефф Далгас
источник
2
@Nevir: Какую информацию вы конкретно после? Как вы думаете, чего не хватает в ответах @ phpguy's и @ Mat ?
eggyal
Извините, я не хотел щедрять это (столкнулся с ошибкой пользовательского интерфейса с SO), но не могу удалить щедрость
Nevir
Вы должны быть в состоянии удалить награду
Акшай Гири FR

Ответы:

138

Ответ phpguy правильный, но я думаю, что в дополнительных деталях много путаницы.

Основной ответ находится в BLOBтипе данных / области атрибута. BLOB - сокращение от Binary Large Object, и этот тип данных столбца специфичен для обработки двоичных данных.

Смотрите соответствующую страницу руководства для MySQL .

Мат
источник
57

Для такой таблицы:

CREATE TABLE binary_data (
    id INT(4) NOT NULL AUTO_INCREMENT PRIMARY KEY,
    description CHAR(50),
    bin_data LONGBLOB,
    filename CHAR(50),
    filesize CHAR(50),
    filetype CHAR(50)
);

Вот пример PHP:

<?php
    // store.php3 - by Florian Dittmer <dittmer@gmx.net>
    // Example php script to demonstrate the storing of binary files into
    // an sql database. More information can be found at http://www.phpbuilder.com/
?>

<html>
    <head><title>Store binary data into SQL Database</title></head>

    <body>
        <?php
            // Code that will be executed if the form has been submitted:

            if ($submit) {
                // Connect to the database (you may have to adjust
                // the hostname, username or password).

                mysql_connect("localhost", "root", "password");
                mysql_select_db("binary_data");

                $data = mysql_real_escape_string(fread(fopen($form_data, "r"), filesize($form_data)));

                $result = mysql_query("INSERT INTO binary_data (description, bin_data, filename, filesize, filetype) ".
                                    "VALUES ('$form_description', '$data', '$form_data_name', '$form_data_size', '$form_data_type')");

                $id= mysql_insert_id();
                print "<p>This file has the following Database ID: <b>$id</b>";

                mysql_close();
            } else {

                // else show the form to submit new data:
        ?>
        <form method="post" action="<?php echo $PHP_SELF; ?>" enctype="multipart/form-data">
            File Description:<br>
            <input type="text" name="form_description"  size="40">
            <input type="hidden" name="MAX_FILE_SIZE" value="1000000">
            <br>File to upload/store in database:<br>
            <input type="file" name="form_data"  size="40">
            <p><input type="submit" name="submit" value="submit">
        </form>

        <?php
            }
        ?>
    </body>
</html>
mauris
источник
9
Этот код выглядит как PHP3 (или, возможно, 4), который включен register_globals. Вы не хотите запускать этот код, и он также не будет работать на полу-современной установке PHP (версии 5).
до
26
-1 для addlashes (), где требуется mysql_real_escape_string (). Можем ли мы прекратить давать людям код с уязвимостями SQL-инъекций? (Нет, addlashes () не достаточно хорош.)
хаос
40

Я настоятельно рекомендую против хранения двоичных данных в реляционной базе данных. Реляционные базы данных предназначены для работы с данными фиксированного размера; вот в чем заключается их производительность: помните старую статью Джоэла о том, почему базы данных такие быстрые? потому что для перехода от записи к другой записи требуется ровно 1 приращение указателя. Если вы добавите BLOB-данные неопределенного и сильно различающегося размера, вы снизите производительность.

Вместо этого храните файлы в файловой системе и сохраняйте имена файлов в своей базе данных.

Алекс Вайнштейн
источник
11
Я не отрицал, но это может быть связано с тем, что он намекает, что вы НИКОГДА не должны делать этого, в отличие от того, чтобы говорить, что большую часть времени это плохая идея. Я согласен с ним в целом, но не в 100% случаев. Могут быть и другие соображения, помимо производительности. Например, я сейчас работаю над чем-то, где производительность вообще не имеет значения. Другие факторы, такие как централизация, простота и резервные копии, означают, что в этом случае хранение в базе данных имеет смысл. Другая распространенная причина - репликация.
LaVache
4
С другой стороны, хранение данных в БД не зависит от ОС, что может быть полезно для странных имен файлов. БД может хранить несколько файлов с одним и тем же именем, а ОС - нет. У него нет проблем чтения / записи / удаления. Для этого не нужна дополнительная система резервного копирования. И это не публично. Так что иногда это быстро в разработке. Btw. никто не заставляет вас хранить все в одной базе данных, в конце концов все заканчивается на диске.
Джори
7
@ AlexWeinstein, вы путаете двоичные данные с данными фиксированной ширины. Двоичные данные также могут быть фиксированной ширины. И данные с фиксированной шириной не подходят для всех ситуаций. Действительно, во многих ситуациях вы бы выиграли от данных переменной ширины: прочитайте последний абзац dev.mysql.com/doc/refman/5.5/en/charset-unicode-utf8mb4.html
Pacerier
4
Согласитесь с @Pacerier в этом, BINARY (16) хранится исправлено. Что касается BLOB: BLOB имеет фиксированный указатель ширины для данных, хранящихся вне таблицы. Это не похоже на varchar или varbinary, которые хранят его в строке. Поиск большого двоичного объекта требует дополнительных действий, но не включайте его в предложение WHERE, и это нормально.
Гарр Годфри
4
я также думаю, что хранение файлов в файловой системе очень сломано и непереносимо. что если файл будет удален?
Гарр Годфри
22

Хотя вы не сказали, что храните, и у вас может быть на то веская причина, часто ответом является «ссылка на файловую систему», а фактические данные находятся где-то в файловой системе.

http://www.onlamp.com/pub/a/onlamp/2002/07/11/MySQLtips.html

Иссак Келли
источник
17

Это зависит от данных, которые вы хотите сохранить. В приведенном выше примере используется LONGBLOBтип данных, но вы должны знать, что существуют другие двоичные форматы данных:

TINYBLOB/BLOB/MEDIUMBLOB/LONGBLOB
VARBINARY
BINARY

У каждого есть свои варианты использования. Если это известная (короткая) длина (например, упакованные данные), часто время BINARYили VARBINARYбудет работать. У них есть дополнительное преимущество в том, что они могут указывать на них.

d0nut
источник
14

Хотя в этом нет необходимости, вы можете попробовать base64закодировать данные и расшифровать их. Это означает, что в БД будут только символы ascii. Это займет немного больше места и времени, но любая проблема, связанная с двоичными данными, будет устранена.

user10117
источник
11

Если поле BLOB - не рекомендуется - вы можете сохранить данные следующим образом:

mysql_query("UPDATE table SET field=X'".bin2hex($bin_data)."' WHERE id=$id");

Идея взята отсюда .

Сообщество
источник
10

Также возникает вопрос, как получить данные в BLOB. Вы можете поместить данные в оператор INSERT, как показывает пример PHP (хотя вы должны использовать mysql_real_escape_string вместо addlashes ). Если файл существует на сервере базы данных, вы также можете использовать MySQL LOAD_FILE

Скотт Нойес
источник
Эта ссылка говорит, что MySQL_real_escape_string устарела.
Пол Бак
10

Когда мне нужно хранить двоичные данные, я всегда использую VARBINARYформат, как было представлено byd0nut.

Документацию можно найти на веб-сайте MySQL в документированной теме 12.4.2. Типы BINARY и VARBINARY.

Если вы спрашиваете, какие преимущества, пожалуйста, посмотрите на вопрос, почему-varbinary-Вместо-VARCHAR

zeppaman
источник