hash-функции - Форум разработчиков электроники ELECTRONIX.ru

реклама на сайте
подробности

Wiki

Photo

Forum

Reviews

Help (!)

Форум разработчиков электроники ELECTRONIX.ru > Cистемный уровень проектирования > Математика и Физика

hash-функции

Опции

romez777 Просмотр профиля	Dec 29 2005, 14:19 Сообщение #1
Местный Группа: Свой Сообщений: 292 Регистрация: 9-11-04 Пользователь №: 1 077	Приветствую Приступил к изучению hash-функций и сразу завяз, столько много методов и сразу не разобраться. Читал материалы на сайте http://algolist.manual.ru/ds/s_has.php не понял, например такого: если хэш-функция должна минимизировать коллизии, то как получается что элемент хэш-таблицы указывает на список элементов - ведь так или иначе функция будет возвращать этот индекс многократно. И еще: как вообще подбирается хэш-функция под задачу, в некоторых примерах используются некие magic numbers, prime числа, для чего они нужны? Если есть доступное описание без особого углубления в математику я бы с удовольствием почитал. Спасибо!

Ответов

_artem_ Просмотр профиля	Dec 29 2005, 15:38 Сообщение #2
учащийся Группа: Свой Сообщений: 1 065 Регистрация: 29-10-05 Из: города контрастов Пользователь №: 10 249	Вообше то это больше магия чем математика. Хеш функции и числа которые используются в них подбираются в зависимости от приложения где вы его используете. Если количество входных значений ограничено и заранее известно какое значение нужно выявить , то лучше , не использовать хеш а что то вроде perfect hashing как здесь http://www.gnu.org/software/gperf/gperf.html. Он анализирует входные значения и генерирует минимального размера код (на С ) для опознания входного значения из множества заданных значений. Prime numbers, если не ошибаюсь это простые числа деляшиеся только на себя и на единицу. Они выбирайтуся на основе тестов результата хеш функции . Задаете тестовое множество вхопдных значений, рассчитываете ключи и вычисляете количество коллизий. При этом вычисления производите итерационно для каждого значения prime number. Впоследствии из этой статистики можно найти для какого prime числа количество коллизий наименьшее . Но это все магия )). Допустим для одного приложения я использовал функцию Пирсона (из DHCP load balancing hash function). Сделал тест написанный выше и получилось что число используемое там не оптимально для моего множества входных данных. Собрав статистику изменяя prime number в алгоритме (если не ошибаюсь там было 31) нашел другое более оптимальное число . Но кроме хеша есть еше и сортируюшие алгоритмы . Домустим на сонове дерева (balanced and unbalanced trees). Или же простейший алгоритм на основе алфавитного упорядочения или же его вариации . Хеш функция должна выбираться на основе входных данных - их количества , возможного разброса значений. Ну а чтобы выбрать , надо их всех сколлекционировать, почитать их достоинства и недостатки и смоделировать тестом для случая вашего множества входных значений . Knuth как отметили до меня содержит эту информацию . Буду дома, посмотрю что еше там есть . -------------------- Зачем лаять на караван , когда на него можно плюнуть?

Сообщений в этой теме

romez777 hash-функции Dec 29 2005, 14:19

mkalexey Доброго времени суток! Цитатаесли хэш-функция ... Dec 29 2005, 15:02

_artem_ Вообше то это больше магия чем математика. Хеш фун... Dec 29 2005, 15:38

romez777 Приветствую. Спасибо за ответы, Кнута обязательно... Jan 3 2006, 09:55

_artem_ посмотрите вот здесь есть обширная подборка хеш фу... Jan 4 2006, 05:39

« Предыдущая тема · Математика и Физика · Следующая тема »

1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)

Пользователей: 0

Режим отображения: Переключить на: Стандартный · Переключить на: Линейный · Древовидный

Подписка на тему · Сообщить другу · Версия для печати · Подписка на этот форум

Текстовая версия

Сейчас: 6th September 2025 - 17:51