260 lines
13 KiB
Plaintext
260 lines
13 KiB
Plaintext
{
|
||
"cells": [
|
||
{
|
||
"cell_type": "markdown",
|
||
"id": "d7f65344",
|
||
"metadata": {},
|
||
"source": [
|
||
"# Отчёт \n",
|
||
"## Телефонный справочник: реализация и сравнение структур данных\n",
|
||
"\n",
|
||
"**Студент:** Коннова Е.А.\n",
|
||
"**Группа:** 429\n",
|
||
"**Дата:**"
|
||
]
|
||
},
|
||
{
|
||
"cell_type": "markdown",
|
||
"id": "f69aa231",
|
||
"metadata": {},
|
||
"source": [
|
||
"## Введение\n",
|
||
"\n",
|
||
"### О чем работа.\n",
|
||
"В данной работе рассматриваются три базовые структуры данных:\n",
|
||
"- Связный список (LinkedList)\n",
|
||
"- Хеш-таблица (HashTable)\n",
|
||
"- Двоичное дерево поиска (BST)\n",
|
||
"\n",
|
||
"Они применяются для хранения записей телефонного справочника.\n",
|
||
"\n",
|
||
"### Цель всей работы\n",
|
||
"Реализовать три структуры данных «с нуля», применить их для хранения записей телефонного справочника и экспериментально сравнить производительность основных операций (вставка, поиск, удаление).\n",
|
||
"\n",
|
||
"### Задачи по достижению цели\n",
|
||
"1. Реализовать связный список с операциями insert, find, delete, list_all\n",
|
||
"2. Реализовать хеш-таблицу на основе связных списков\n",
|
||
"3. Реализовать двоичное дерево поиска\n",
|
||
"4. Сгенерировать тестовые данные (10000 записей)\n",
|
||
"5. Провести замеры времени для каждой структуры (5 повторений)\n",
|
||
"6. Сравнить результаты и сделать выводы"
|
||
]
|
||
},
|
||
{
|
||
"cell_type": "markdown",
|
||
"id": "56e2f617",
|
||
"metadata": {},
|
||
"source": [
|
||
"## Часть 1. Общая информация о структурах данных\n",
|
||
"\n",
|
||
"### 1.1 Для неспециалистов\n",
|
||
"\n",
|
||
"**Что такое структура данных?**\n",
|
||
"Это способ организации и хранения данных в компьютере.\n",
|
||
"\n",
|
||
"**Три структуры из работы:**\n",
|
||
"\n",
|
||
"| Структура | Как работает | Пример из жизни |\n",
|
||
"|-----------|--------------|-----------------|\n",
|
||
"| Связный список | Цепочка элементов, где каждый знает следующий | Верёвка с узелками |\n",
|
||
"| Хеш-таблица | Массив корзин, элемент попадает в корзину по номеру | Картотека с ящиками |\n",
|
||
"| Двоичное дерево | Иерархическая структура: левые меньше, правые больше | Телефонный справочник |\n",
|
||
"\n",
|
||
"### 1.2 Обзор технологий\n",
|
||
"\n",
|
||
"**Связный список**\n",
|
||
"- Узел: `{'name': str, 'phone': str, 'next': None}`\n",
|
||
"- Вставка: O(1) в начало, O(n) в конец\n",
|
||
"- Поиск: O(n) - линейный обход\n",
|
||
"- Удаление: O(n) - сначала найти\n",
|
||
"\n",
|
||
"**Хеш-таблица**\n",
|
||
"- Корзины: список из None или голов списков\n",
|
||
"- Хеш-функция: `hash = (hash * 31 + ord(ch)) % size`\n",
|
||
"- Вставка/поиск/удаление: O(1) в среднем\n",
|
||
"\n",
|
||
"**Двоичное дерево поиска (BST)**\n",
|
||
"- Узел: `{'name': str, 'phone': str, 'left': None, 'right': None}`\n",
|
||
"- Вставка/поиск/удаление: O(log n) в среднем, O(n) в худшем\n",
|
||
"\n",
|
||
"### 1.3 Обоснование выбора подхода\n",
|
||
"\n",
|
||
"**Почему именно эти структуры?**\n",
|
||
"1. Они фундаментальны и изучаются в курсе\n",
|
||
"2. Показывают разные компромиссы (скорость vs порядок)\n",
|
||
"3. Позволяют наглядно сравнить производительность\n",
|
||
"\n"
|
||
]
|
||
},
|
||
{
|
||
"cell_type": "markdown",
|
||
"id": "d9327709",
|
||
"metadata": {},
|
||
"source": [
|
||
"## Часть 2. Техническая реализация\n",
|
||
"\n",
|
||
"### 2.1 Постановка задачи\n",
|
||
"\n",
|
||
"Реализовать телефонный справочник с операциями:\n",
|
||
"- `insert(name, phone)` — добавить или обновить запись\n",
|
||
"- `find(name)` — вернуть телефон или None\n",
|
||
"- `delete(name)` — удалить запись\n",
|
||
"- `list_all()` — вернуть все записи, отсортированные по имени\n",
|
||
"\n",
|
||
"### 2.2 Верхнеуровневое решение\n",
|
||
"\n",
|
||
"**Связный список (LinkedList)**\n",
|
||
"- `ll_insert(head, name, phone)` — добавление в конец, возвращает голову\n",
|
||
"- `ll_find(head, name)` — линейный поиск, возвращает телефон или None\n",
|
||
"- `ll_delete(head, name)` — удаление с перепривязкой, возвращает голову\n",
|
||
"- `ll_list_all(head)` — сбор всех записей и сортировка\n",
|
||
"\n",
|
||
"**Хеш-таблица (HashTable)**\n",
|
||
"- `hash_function(name, size)` — ключ → номер корзины\n",
|
||
"- `ht_create(size)` — создание таблицы\n",
|
||
"- `ht_insert(buckets, name, phone)` — вызов ll_insert для нужной корзины\n",
|
||
"- `ht_find(buckets, name)` — вызов ll_find для нужной корзины\n",
|
||
"- `ht_delete(buckets, name)` — вызов ll_delete для нужной корзины\n",
|
||
"- `ht_list_all(buckets)` — сбор из всех корзин + сортировка\n",
|
||
"\n",
|
||
"**Двоичное дерево (BST)**\n",
|
||
"- `bst_insert(root, name, phone)` — итеративная вставка\n",
|
||
"- `bst_find(root, name)` — поиск\n",
|
||
"- `bst_delete(root, name)` — удаление с поиском преемника\n",
|
||
"- `bst_list_all(root)` — in-order обход (уже отсортировано)"
|
||
]
|
||
},
|
||
{
|
||
"cell_type": "markdown",
|
||
"id": "c1cd08d8",
|
||
"metadata": {},
|
||
"source": [
|
||
"## Часть 3. Эксперименты и результаты\n",
|
||
"\n",
|
||
"### 3.1 Инструменты и методика\n",
|
||
"\n",
|
||
"**Параметры эксперимента:**\n",
|
||
"- Количество записей: 10 000\n",
|
||
"- Количество повторений: 5\n",
|
||
"- Поиск: 100 существующих + 10 несуществующих\n",
|
||
"- Удаление: 50 случайных записей\n",
|
||
"- Режимы: случайный порядок, отсортированный порядок\n",
|
||
"\n",
|
||
"### 3.2 Результаты"
|
||
]
|
||
},
|
||
{
|
||
"cell_type": "markdown",
|
||
"id": "94634c57",
|
||
"metadata": {},
|
||
"source": [
|
||
"\n",
|
||
"\n",
|
||
"*Таблица 1 - Результаты экспериментов (среднее время в секундах)*"
|
||
]
|
||
},
|
||
{
|
||
"cell_type": "markdown",
|
||
"id": "5689bbd0",
|
||
"metadata": {},
|
||
"source": [
|
||
"### 3.3 Графики\n",
|
||
"\n",
|
||
"#### График 1: Время вставки 10000 записей\n",
|
||
"\n",
|
||
"\n",
|
||
"\n",
|
||
"#### График 2: Время поиска 110 записей\n",
|
||
"\n",
|
||
"\n",
|
||
"\n",
|
||
"#### График 3: Время удаления 50 записей\n",
|
||
"\n",
|
||
""
|
||
]
|
||
},
|
||
{
|
||
"cell_type": "markdown",
|
||
"id": "5561d9dd",
|
||
"metadata": {},
|
||
"source": [
|
||
"### 3.4 Сравнение и анализ\n",
|
||
"\n",
|
||
"**Как порядок входных данных влияет на BST?**\n",
|
||
"\n",
|
||
"| Режим | Вставка | Поиск | Удаление |\n",
|
||
"|-------|---------|-------|----------|\n",
|
||
"| Случайный | 0.026 сек | 0.00026 сек | 0.00017 сек |\n",
|
||
"| Отсортированный | 4.931 сек | 0.047 сек | 0.023 сек |\n",
|
||
"\n",
|
||
"Вывод: На случайных данных BST работает быстро (O(log n)). На отсортированных данных BST вырождается в связный список (O(n)). Работает медленее в 190 раз.\n",
|
||
"\n",
|
||
"**Техническая ошибка:** Из-за ограничения глубины рекурсии в Python (1000 вызовов) рекурсивная реализация BST не смогла бы обработать 10000 записей. Поэтому все операции BST были реализованы итеративно.\n",
|
||
"\n",
|
||
"**Почему хеш-таблица не чувствительна к порядку?**\n",
|
||
"\n",
|
||
"Хеш-функция распределяет записи по корзинам независимо от порядка вставки. Распределение по корзинам равномерное.\n",
|
||
"\n",
|
||
"**Почему связный список всегда медленен при поиске?**\n",
|
||
"\n",
|
||
"Связный список не имеет индексов. Поэтому нужно перебирать элементы последовательно. Сложность поиска - O(n).\n",
|
||
"\n",
|
||
"**Как удаление работает в каждой структуре?**\n",
|
||
"\n",
|
||
"| Структура | Сложность |\n",
|
||
"|-----------|-----------|\n",
|
||
"| LinkedList | O(n) |\n",
|
||
"| HashTable | O(1) |\n",
|
||
"| BST | O(log n) / O(n) |\n",
|
||
"\n",
|
||
"В связных списках сначала нужно найти, потом перепривязать. В хеш-таблице сразу находишь корзину по хешу. В двоичном дереве нужно найти узел и перестроить поддеревья."
|
||
]
|
||
},
|
||
{
|
||
"cell_type": "markdown",
|
||
"id": "a57d1502",
|
||
"metadata": {},
|
||
"source": [
|
||
"## Заключение\n",
|
||
"\n",
|
||
"### Выводы из каждой части\n",
|
||
"\n",
|
||
"**Из части 1:**\n",
|
||
"- Каждая структура имеет свои теоретические характеристики\n",
|
||
"- Связный список - прост, но медленен\n",
|
||
"- Хеш-таблица - быстра, но не сохраняет порядок\n",
|
||
"- BST - быстр и сохраняет порядок, но требует балансировки\n",
|
||
"\n",
|
||
"**Из части 2:**\n",
|
||
"- Все три структуры успешно реализованы\n",
|
||
"- Хеш-таблица использует связный список для корзин\n",
|
||
"- BST написан итеративно для избежания RecursionError\n",
|
||
"\n",
|
||
"**Из части 3:**\n",
|
||
"- Эксперименты подтвердили теоретические оценки\n",
|
||
"- BST на отсортированных данных деградирует\n",
|
||
"- Хеш-таблица стабильна независимо от порядка\n",
|
||
"\n",
|
||
"### Итоговая рекомендация\n",
|
||
"\n",
|
||
"| Сценарий | Рекомендация | Причина |\n",
|
||
"|----------|--------------|---------|\n",
|
||
"| Частый поиск по ключу | Хеш-таблица | O(1) |\n",
|
||
"| Частые вставки/удаления | Хеш-таблица | Стабильная скорость |\n",
|
||
"| Нужен отсортированный вывод | Сбалансированное дерево | In-order обход |\n",
|
||
"| Данные поступают отсортированно | Хеш-таблица | BST деградирует |\n",
|
||
"| Мало данных (<100) | Любая | Разница незаметна |\n",
|
||
"\n",
|
||
"**Для телефонного справочника лучший выбор - хеш-таблица.**"
|
||
]
|
||
}
|
||
],
|
||
"metadata": {
|
||
"language_info": {
|
||
"name": "python"
|
||
}
|
||
},
|
||
"nbformat": 4,
|
||
"nbformat_minor": 5
|
||
}
|