|
Что быстрее и производительнее, запись в MySQL или в файлы? |
|
|
2 страниц
1 2 >
|
 |
Ответов
(1 - 28)
|
Jul 14 2014, 19:51
|
Частый гость
 
Группа: Свой
Сообщений: 150
Регистрация: 13-10-05
Пользователь №: 9 614

|
Цитата(Alt.F4 @ Jul 14 2014, 22:01)  P.S. Я задался этим вопросом, т.к. MySQL хранит свои таблицы в оперативной памяти, которая намного быстрее жесткого диска. OS тоже не пишет прямо на диск кстати, если об этом прямо не просить. Данные сначала помещаются в буфер, а затем уже более крупными кусками сбрасываются на диск. Судя по тому что вы написали вам нужна скорость записи 100кб/с. Современные винчестеры могут гораздо больше. Однако в любом случае (MySQL, memory mapping, прямая запись на диск или даже прямая запись в предварительно выделенный буфер в ОЗУ) не следует ожидать, что OS будет готова принять ваши данные каждые 1 мс.
|
|
|
|
|
Jul 15 2014, 05:42
|

Ally
     
Группа: Модераторы
Сообщений: 6 232
Регистрация: 19-01-05
Пользователь №: 2 050

|
Цитата(andrewlekar @ Jul 15 2014, 07:09)  Быстрее писать в файлы. Если потом будете по этим данным что-то искать, то mysql будет делать выборку значительно быстрее, чем вы сможете это сделать руками. Прям так безапелляционно? Не глядя ни какая файловая система, ни какая дефрагментация у диска, ни как загружена система другими файловыми операциями , ни какой приоритет у процесса пользователя, ни какие перехватчики на файловых операциях, ни как осуществляется контроль доступа к файлу,... А если еще раз подумать? Цитата(Alt.F4 @ Jul 15 2014, 08:37)  DASM, ms1, andrewlekar, спасибо большое! Данные приходят из сети, поиска по ним не надо, загружаться потом будут полностью из файлов. Думал, что когда пишем напрямую на винт, то производительность всей системы будет ниже, т.к. к винту обращаются постоянно N-ое количество программ. А что, кто-то привел цифры, убедительные аргументы? SQL сервера специально затачиваются под быстродействие операций не только выборки, но и сохранения.
|
|
|
|
|
Jul 15 2014, 06:04
|
Знающий
   
Группа: Участник
Сообщений: 837
Регистрация: 8-02-07
Пользователь №: 25 163

|
Цитата А если еще раз подумать? А если ещё раз подумать, то ни на какой вопрос вообще нельзя 100% объективно ответить. Из общих соображений, SQL сервера заточены под работу с кортежами данных, как правило для быстрой выборки по индексу с не очень быстрой вставкой. Если в mysql писать с частотой в 1000 Гц неструктурированные данные, производительность будет трещать по швам.
|
|
|
|
|
Jul 15 2014, 06:31
|
Знающий
   
Группа: Участник
Сообщений: 837
Регистрация: 8-02-07
Пользователь №: 25 163

|
Цитата Какие вообще большие структуры могут не использовать индекс для поиска? Видео, картинки, музыка.
|
|
|
|
|
Jul 15 2014, 06:31
|
Участник

Группа: Участник
Сообщений: 55
Регистрация: 13-09-12
Пользователь №: 73 530

|
О чем вообще речь? 100 байт раз в миллисекунду - это 100Кб/с, то есть вообще не ощутимо для любого (особенно современного) ПК, а если буферизировать запись и писать один раз в секунду или реже, то вообще как слону дробина. Делать что ли нечего, занялись преждеверменной оптимизацией? Ну давайте, можете взять базу данных, лучше быструю NoSQL какую-нибудь, оперативки докупить 32 Гб, четыре SSD диска в RAID0 поставить, коли заняться нечем.
|
|
|
|
|
Jul 15 2014, 06:48
|

Ally
     
Группа: Модераторы
Сообщений: 6 232
Регистрация: 19-01-05
Пользователь №: 2 050

|
Цитата(menzoda @ Jul 15 2014, 09:31)  О чем вообще речь? 100 байт раз в миллисекунду - это 100Кб/с, то есть вообще не ощутимо для любого (особенно современного) ПК, а если буферизировать запись и писать один раз в секунду или реже, то вообще как слону дробина. Делать что ли нечего, занялись преждеверменной оптимизацией? Ну давайте, можете взять базу данных, лучше быструю NoSQL какую-нибудь, оперативки докупить 32 Гб, четыре SSD диска в RAID0 поставить, коли заняться нечем. Ну да 8 Гиг в сутки. Вот и ворочайте такими файлами как семечками с помощью файловой системы. Сразу захочется чего то побыстрей да поавтоматизированней. Цитата(andrewlekar @ Jul 15 2014, 09:31)  Видео, картинки, музыка. Что, парсили контейнеры mkv и проч.? Там один встроенный XML уже требует движка базы данных.
|
|
|
|
|
Jul 15 2014, 07:15
|
Участник

Группа: Участник
Сообщений: 55
Регистрация: 13-09-12
Пользователь №: 73 530

|
Какая разница сколько получается в сутки? Вопрос был про производительность при записи, ворочать ничем не надо, зачем придумывать задачи, которые ТС не требовал. Да пусть бы и двадцать гагабайт, заполнили один файл - создаем другой.
Вот и ворочайте такими файлами как семечками с помощью файловой системы. А база данных прям будет квантами во всемирном эфире манипулировать. Она точно так же будет использовать файловую систему и создавать точно такие же гигабайтные файлы (SQLite), или, что хуже, десятки файлов поменьше (MySQL к примеру). База данных хороша, если надо обрабатывать сотни гигабайт сложносвязанных данных, а не вести лог 100Кб/с.
Сообщение отредактировал menzoda - Jul 15 2014, 07:15
|
|
|
|
|
Jul 15 2014, 19:35
|
практикующий тех. волшебник
    
Группа: Участник
Сообщений: 1 190
Регистрация: 9-09-05
Пользователь №: 8 417

|
Цитата(Alt.F4 @ Jul 14 2014, 23:01)  ..т.к. MySQL хранит свои таблицы в оперативной памяти, которая намного быстрее жесткого диска. Надо дальше копать условия. сравнивать. В памяти хранить данные - хранят. но это не значит что на момент вставки не будет произведена операция обеспечивающая целостность данных - т.е. сброс в кэш (обычно) и далее в таблицы. и то и то - винт обычно. Выборка по условия скорее всего будет лучше, если требуется некий анализ либо гибкое связывание табличных данных. (пример: в своё время участвовал в разработки своей ОО БД. задействован был в частности в создании низкоуровневого движка. По скорости шустрее беркли вышло, под форточками. Но то и понятно. У берлки - там ышо транзакционный слой, языковая поддержка, и т.д. и т.п.. Т.е. фокусов нет, если скорость то обычно за счёт чего то.) таблицы используют файловую систему. исключение составляет специальные аппаратные БД. Типа AS400 от IBM. Там нет в принципе понятие файловой системы. Соответственно и выигрыш по скорости получается. Надо так-же понимать, что работа самой БД определяется многими параметрами. Политикой изоляции, транзакционности и прочая лабуда. Т.е. вполне возможно сегодня БД будет шустро, а завтра повернув выключатель в настройках Вы можелете получить другую картину. Всё зависит уже от конкретики. Отсюда и надо плясать собственно. Если Вам универсальность, отказоустойчивость, многопользовательский доступ, миграция в будущем, стандартные административные заморочки - то напрашивается БД. Если есть механизм конкретной заточки под конкретное железо (кстати и форточки можно до ума доводить - но то уже лучше копнуть любителей писать игры реал-тайм под форточками = многое чаво интересного можно подчерпнуть, кстати) и Вы сами с усами на любом уровне абстракции в конкретной оси - то лучше сделать шустро  MySQL конечно же лёгкая БД. Но всё же это БД.
|
|
|
|
|
Jul 18 2014, 06:12
|
Участник

Группа: Участник
Сообщений: 55
Регистрация: 13-09-12
Пользователь №: 73 530

|
Цитата(AlexandrY @ Jul 18 2014, 09:37)  В смысле слили проблему другим? Скорее закрутил единственный шуруп отверткой, не доставая из дальнего угла гаража шуруповерт, что есть правильно. Недавно видел подобное обсуждение, на реддите вроде, так вот там правильно сказали, что если единственный имеющийся инструмент - это молоток, то все вокруг будет выглядеть гвоздем. Я про то, что если в какой-то области реляционная база данных это круто и удобно, то не надо пихать ее во всё.
Сообщение отредактировал menzoda - Jul 18 2014, 06:13
|
|
|
|
|
Jul 24 2014, 19:51
|
практикующий тех. волшебник
    
Группа: Участник
Сообщений: 1 190
Регистрация: 9-09-05
Пользователь №: 8 417

|
Цитата(Alt.F4 @ Jul 24 2014, 14:28)  ...мы его откроем другой программой для просмотра?.. в конечном итоге зависит от реализации оси и ФС. Если брать бытовой виндоус, то есть флаги при открытии файла - именно они могут ограничить режимы открытия одного и того-же файла разными процессами. Далее только способ общения и способ синхронизации буферов (на уровне ФС, оси, драйверов)... Обычно ФС сразу предствляют лёгкий закос на объекты синхронизации - блокировки участка файла. Обычно это использовалось до клиент-серверные времена. Или точнее сказать во времена многопользовательского доступа с помощью файовых систем. Яркий представитель этого хозяйства - клиппер, dbf формат, способ блокировок и доступа к БД файлам.
|
|
|
|
|
Jul 25 2014, 14:02
|

Знающий
   
Группа: Участник
Сообщений: 974
Регистрация: 4-04-08
Из: далека
Пользователь №: 36 467

|
Цитата(Alt.F4 @ Jul 25 2014, 09:57)  Сегодня провел опыты на VPS Windows Server 2003. Результаты удручающие, прямая запись на жесткий диск сильно замедлила систему, загрузка ЦП 100%. Вернул запись в MySQL, все летает... з.ы. возможно все дело в соседях, но БД тоже ведь юзает HDD. Ларчик просто открывается, майсиквел пишет все в кэш, периодически сбрасывая его на диск, если шнур выдернуть, то окажется, что записалось не все. Чудес то не бывает. Он пользуется теми же сервисами записи на диск. Поэтому быстрее никак быть не может Цитата(Alt.F4 @ Jul 24 2014, 06:28)  Я не разбираюсь в файловых системах, и возник вопрос: что произойдет, если в момент записи данных в файл, мы его откроем другой программой для просмотра? Спасибо. Ничего плохого. Зависит от ОС, будет ли он видеть новые данные или нет.
--------------------
Верить нельзя никому, даже себе. Мне - можно.
|
|
|
|
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0
|
|
|