Оригинальная версия: Английский
Это мой учебный план рассчитанный на несколько месяцев для веб-разработчиков, не имеющих образования в Computer Science (CS) и планирующих работать инженерами-программистами (software engineer) в компании Google.
За основу учебного плана я взял список вопросов Google's coaching notes и значительно расширил его. Тут вы найдёте много полезных вещей, которые необходимо знать. Дополнительные вопросы я добавил в конец списка, их могут задавать на интервью, так же они могут быть полезны в решении повседневных задач. Некоторые пункты я взял из поста Стива Йеги (Steve Yegge) "Получить работу в Google", а некоторые слово в слово соответствуют вопросам, разбираемых Google в их постах о подготовке.
Я сократил тот объем знаний, который необходим, по сравнению с рекомендациями Йеги. Я изменил требования Йеги исходя из той информации, которую мне предоставил мой знакомый из Google. Это важно для тех, кто сейчас еще новички в разработке программного обеспечения или являются веб-разработчиками и планируют стать инженерами-программистами (это та профессия где требуются знания в области CS). Если вы опытный разработчик, ожидайте что собеседование будет сложным. Подробнее.
Если вы обладаете многолетним опытом разработки ПО, помните, что Google разделяет понятия инженер-программист и разработчик ПО/веб-разработчик. Первое требует знаний в области CS.
Если вы хотите быть инженерами обеспечивающими надежность ПО или системными инженерами, то уделить внимание вопросом из опционального списка (разделы сеть, безопасность).
- Для кого это?
- Чем это полезно?
- Как пользоваться
- Получи гугловское настроение
- Получил ли я работу?
- Двигайся вместе со мной
- Не переживайте о том, что вы не достаточно умны
- О Google
- О видео ресурсах
- Процесс собеседования & Основное в подготовке к интервью
- Выберите один язык для собеседования
- Список книг
- Перед тем как вы начнете
- Что еще не охвачено
- Необходимые знания
- План на день
- Сложность алгоритмов / Big-O / Асимптотический анализ
- Структуры данных
- Дополнительно
- Деревья
- Деревья
- Двоичное дерево поиска: BSTs
- Куча / Очередь с приоритетом / Двоичная куча
- Сбалансированные деревья поиска (основная идея, без деталей)
- Обходы: прямой, симметричный, обратный, BFS, DFS
- Сортировка
- выбором
- вставками
- пирамидальная
- быстрая
- слиянием
- Графы
- ориентированные
- неориентированные
- матрица смежности
- лист смежности
- обходы: BFS, DFS
- Еще больше знаний
- Проектирование систем, Масштабируемость, Обработка данных (if you have 4+ years experience)
- Финальный обзор
- Практические вопросы по программированию
- Упражнения по программированию
- Перед собеседованием
- Ваше резюме
- О чем нужно думать на собеседовании
- Вопросы к собеседующим
- После того как вы получили работу
---------------- Все что ниже - опционально ----------------
- Дополнительные книги
- Дополнительное обучение
- Динамическое программирование
- Компиляторы
- Числа с плавующей запятой
- Unicode
- Порядок следования байт
- Emacs и vi(m)
- Командная строка Unix
- Теория информации
- Четность & Код Хемминга
- Энтропия
- Криптография
- Сжатие
- Сети (if you have networking experience or want to be a systems engineer, expect questions)
- Компьютерная безопасность
- Сборщики мусора
- Параллельное программирование
- Сообщения, сериализация и системы очередей
- Быстрое преобразование Фурье
- Фильтр Блума
- HyperLogLog
- Локально-чувствительное хеширование
- Дерево ван Эмде Боаса
- Дополнительные структуры данных
- Префиксные деревья
- N-арные (K-арные, M-арные) деревья
- Сбалансированные деревья поиска
- АВЛ деревья
- Splay-деревья
- Красно-черные деревья
- 2-3 деревья поиска
- 2-3-4 деревья
- N-арные (K-арные, M-арные) деревья
- B-деревья
- k-D деревья
- Списки с пропусками
- Сеть
- Система непересекающихся множеств
- Математика для быстрой обработки
- Декартово дерево
- Линейное программирование
- Геометрия, Выпуклая оболочка
- Дискретная математика
- Машинное обучение
- Go
- Дополнительные детали
- Видео
- Курсы по Computer Science
Я следую этому плану, готовясь к собеседованию в Google. Я разрабатываю веб-приложения, сервисы и запускаю стартапы с 1997 года. У меня есть степень по экономике, но нет по CS. До сих пор у меня очень успешная карьера, но я хочу работать в Google. Я хочу работать с большими системами и понять принципы их работы, изучить эффективность алгоритмов и различные структуры данных, узнать, как работают низкоуровневые языки программирования. Если ты не знаешь что-то из перечисленного, Google не возьмёт тебя на работу.
Когда я начал этот проект, я ничего не знал о стеке, куче, Big-O, деревья и способах обхода графа. Если бы мне нужно было писать код для сортировки, это было бы не очень хорошо. Структуры данных, которые я использовал, были частью языка, и я не знал, как они на самом деле работали. Мне никогда не приходилось управлять памятью, если процесс, который я запускал, сообщал об ошибке "out of memory", я искал способ как ее обойти. Я использовал в своей работе несколько многомерных массивов и тысячи ассоциативных, но никогда не создавал структуру данных "с нуля".
Но после выполнения этого учебного плана я поверил, что Google меня наймет. Это длинный путь. Я потрачу на это месяцы. Если вы уже знакомы с большинством тем, то потратите намного меньше времени.
Ниже описан способ использования, вы должны выпонить пункты в описаном порядке.
Я использую разметку Github, включая список задач для оценки прогресса.
-
Создай новую ветку и тогда вы сможете оставлять отметки у элементов списка, просто добавляя x внутрь скобок: [x]
Скопируй репозиторий и выполни команды перечисленные ниже
git checkout -b progress
git remote add jwasham https://github.com/jwasham/google-interview-university
git fetch --all
Mark all boxes with X after you completed your changes
git add .
git commit -m "Marked x"
git rebase jwasham/master
git push --force
Подробнее о разметке на Github
Напечатай знак "future Googler" и не отводи глаз от желанной добычи.
Пока я ожидаю своей очереди. Надеюсь интервью будет скоро.
Thanks for the referral, JP.
Моя история: Почему я готовился в течении 8 месяцев для собеседования в Google
Я еще на пути к цели. Двигаемся вперед:
- Blog: GoogleyAsHeck.com
- Twitter: @googleyasheck
- Twitter: @StartupNextDoor
- Google+: +Googleyasheck
- LinkedIn: johnawasham
- Инженеры в Google умные, но многие из них переживают что недостаточно, хотя там уже работают.
- Миф о гениальных программистах
- Это опасно, идти в одиночку: Сражаться с невидимыми монстрами в технологиях
- Для студентов - Google Careers: Руководство по развитию в технологиях
- Как работает поиск:
- Серии:
- Книга: Как работает Google
- Made by Google announcement - Oct 2016 (video)
Некоторые видео доступно в том случае, если вы являетесь слушателями курсов Coursera, EdX или Lynda.com Их называют MOOCs. Некоторые курсы не имеют круглогодичного доступа и вам нужно подождать несколько месяцев, прежде чем получите к ним доступ. Курсы на Lynda.com платные.
Я был бы вам благодарен за помощь в добавлении бесплатных, всегда доступных публичных ресурсов, таких
как видео с YouTube сопровождающих онлайн курсы. Мне нравяться использовать университетские лекции.
-
Видео:
- Как работать в Google: Подготовка к собеседованию на позицию инженера (видео)
- Как работать в Google: Пример кодирования/Собеседование инженера (видео)
- Как работать в Google - Подготовка кандидатов (видео)
- Советы для технического собеседования от рекрутеров из Google (видео)
- Как работать в Google: Подготовка технического резюме (видео)
-
Статьи:
- Стать гуглером за три шага
- Получить работу Google
- все что он упоминает из того что вы должны знать перечисленно ниже
- (сильно устаревшее)Как получить работу в Google, Вопросы на собеседовании, Процесс найма
- Вопросы с собеседования по телефону
-
Подготовительные курсы:
- Собеседование инженера-программиста (платный курс):
- Как самостоятельно подготовиться r собеседованию на позицию инженера-программиста от бывшего сотрудника Google
- Собеседование инженера-программиста (платный курс):
-
Дополнительно (это не рекомендация Google, а моя собственная):
- ABC: Программируй всегда
- 4 шага в Google без образованияв CS
- Кодирование на доске
- Что думает Google о найме, управлении и культуре
- Эффективное кодирование на доске в процессе собеседования
- Прохождения собеседования по программированию набор 1:
- Как получить работу в большой четверке:
- Ошибки на собеседованиях в Google
Я написал небольшую статью об этом: Важно: Выберите один язык для собеседования в Google
На этапе собеседования, когда требуется программировать, вы можете использовать наиболее комфортный для вас язык программирования. Для Google лучшим выбором будут следующие:
- C++
- Java
- Python
Так же подойдут:
- JavaScript
- Ruby
Для вас должно быть комфортно писать программы на выбранном языке и вы должны его хорошо знать.
Подробнее о выборе:
- http://www.byte-by-byte.com/choose-the-right-language-for-your-coding-interview/
- http://blog.codingforinterviews.com/best-programming-language-jobs/
- https://www.quora.com/What-is-the-best-language-to-program-in-for-an-in-person-Google-interview
Ресурсы по языкам программирования вы можете найти тут
Вы найдете кое-что по С, С++ и Python ниже, потому-что я еще в процессе обучения.
Это краткий список, того чем я пользовался. Он сокращен, для того что-бы сэкономить ваше время.
- Собеседование по программированию в подробнастях: Секреты получения твоей следующей работы, 2-е издание
- ответы на C++ и Java
- рекомендации Google по обучению кандидатов
- это отличная разминка перед подробным разбором собеседования по программированию
- не так уж и сложно, некоторые задачи проще чем вам кажутся на собеседовании (из того что я прочитал)
- Разбор собеседования по программированию, 6-е издание
- ответа на Java
- рекомендована Google Careers сайт
- Если вы видели ссылку на "The Google Resume", эта книга заменена "Разбор собеседования по программированию" ("Cracking the Coding Interview").
Если у вас есть много свободного времени:
- Элементы собеседования по программированию
- весь код написан на C++, полезна если вы планируете использовать C++ на собеседовании
- хорошая книга, описывающая решения общих задач.
Если мало времени:
- Писать отличный код: Том 1: Понимание компьютера
- Книга была опубликована в 2004 и отчасти она устарела, но благодаря ей вы быстро поймете как устроены компьютеры.
- Автор придумал HLA, поэтому скептически отнеситесь к примерам и упоминаниям HLA. Широко не используется, но содержит ряд примеров, демострирующих assembler.
- Чтение следующих глав не займет много времени и даст хорошую основу:
- Глава 2 - Представление в числовой форме
- Глава 3 - Двоичная арифметика и битовые операции
- Глава 4 - Представление числа с плавующей запятой
- Глава 5 - Представление символа
- Глава 6 - Организация памяти и доступа
- Глава 7 - Составные типы данных и объекты в памяти
- Глава 9 - Архитектура CPU
- Глава 10 - Набор инструкций
- Глава 11 - Архитектура и организация памяти
Если вы рапологаете свободным временем (я хочу купить эту книгу):
Вам необходимо выбрать один язык для интервью (смотри выше). Здесь вы найдете мои рекомендации по языкам. У меня нет информации по всем языкам, но если есть у вас - добро пожаловать.
Если вы читали одну из них, то у вас есть достаточно знаний по алгоритмам и структурам данных и вы можете приступить к решению задач по программированию. Вы можете пропустить все видео лекции в этом разделе, если не хотите повторить темы.
Дополнительные ресурсы по языкам программирования здесь
Я не читал обе, но они весьма полезны и написаны Седжвиком (Sedgewick). Он отличный автор.
- Алгоритмы на C++, Части 1-4: Основы, Структуры данных, Сортировка, Поиск
- Алгоритмы на C++ Часть 5: Алгоритмы графов
Если вы можете порекоммендовать литературу по C++, которая лучше, сообщите мне об этом. Я ищу лучшие книги.
- Алгоритмы (Седжвик и Вайн)
- книга с видео контентом (и Седжвик!):
или:
- Структуры данных и алгоритмы на Java
- авторы Goodrich, Tamassia, Goldwasser
- используется в Беркли США как опциональный учебник по введению в CS
- смотрите мой отчет по книги по Python ниже. Эта книга содержит те же темы.
- Структуры данных и алгоритмы на Python
- авторы Goodrich, Tamassia, Goldwasser
- Я люблю эту книгу. Она содержит все что нужно и даже больше.
- Pythonic code
- мой отчет по книге: https://googleyasheck.com/book-report-data-structures-and-algorithms-in-python/
**Некоторые рекомендую эти книги, но я думаю это перебор, если только вы не инженер-программист с большим опытом работы и не ожидаете более сложного собеседования.
-
Руководство по разработке алгоритмов (Skiena)
-
Как обзор и описание проблем
-
Некоторые алгоритмы вряд ли попадутся вам на собеседовании.
-
Эта книга состоит из 2-х частей:
- классный учебник по структурам данных и алгоритмам
- преимущества:
- отличный учебник, содержащий обзор существующих алгоритмов
- автор описывает реальный опыт решения задач как академических, так и промышленных
- примеры кода написаны на C
- недостатки:
- местами изложение может быть не очевидным и не понятным как в CLRS (Cormen, Leiserson, Rivest, Stein), некоторые темы лучше описаны в CLRS
- главы 7, 8, 9 сложно понять, некоторые вещи плохо разъяснены или требуют больших знаний чем есть у меня
- не поймите меня не правильно: Мне нравиться Skiena, ее стиль и манера изложения, но я не могу стать физически Stony Brook.
- преимущества:
- каталог алгоритмов:
- это реальная причина, почему следует купить эту книгу.
- о том как дойти до этой части. Обновлю, когда изучу этот раздел.
- классный учебник по структурам данных и алгоритмам
-
Цитата Йеги: "Больше чем какая-либо другая книга, эта помогла мне понять насколько банальны задачи на графы - они должны быть в инструментарии каждого программиста. Книга так же включает в себя разбор базовых структур данных и алгоритмов сортировки, что является приятным бонусом. Но важнейшей частью стала вторая часть книги, которая написана как энциклопедия, описывающая большое количество различных алгоритмических задач и способов их решения без лишних деталей. Почти каждая страница-описание содержит изображение, облегчающее запоминание. Это полезный способ, позволяющий запомнить и в последствии идентифицировать сотни типов задач."
-
Можете ее арендовать
-
Half.com - отличный ресурс, где можно заказать книги по выгодным ценам.
-
Ответы:
-
-
- Важно: Чтение этой книги будет полезно только для повторения алгоритмов и структур данных. Она не научит вас программировать.
- Цитата Йеги: "Но если вы хотите идти на собеседование, отложите его пока не изучите эту книгу."
- Half.com - отличный ресурс, где можно заказать книги по выгодным ценам.
- известная как CLR, иногда CLRS, потому что Stein опоздал на игру
-
- В первых двух главах представлены решения задач программирования (в некоторых из них используются устаревшие типы данных), но это только введение. Это руководство по разработке программ и архитектуре, такое же как Code Complete, но более краткое.
-
"Алгоритмы и программирование: Проблемы и решения" автор Shen- Отличная книга, но после разбора нескольких задач написанных на Pascal я разочаровался в его синтаксисе.
- Лучше провести время решая задачи по программированию из других книг или онлайн ресурсов.
Я создавал эту учебную программу на протяжении нескольких месяцев своими руками.
Ниже я описал некоторые ошибки, которые я совершил. Это поможет вам их избежать.
Я смотрел часами видео делая заметки, но спустя несколько месяцев многое из этого я не помнил. После чего потратил 3 дня разбираясь в своих заметках и делая карточки-напоминания(flashcards), для того что бы потом можно было повторить пройденный материал.
Прочитайте пожалуйста эту статью, что бы не совершать моих ошибок:
Для решения этой проблемы я сделал не большой сайт, на котором можно добавлять карточки двух типов: общие и с кодом. Каждая карта имеет разный формат.
Я сделал мобильную версию сайта и могу читать карточки на мобильном телефоне или планшете.
Сделай свой собственный бесплатно:
- Репозиторий сайта Flashcards
- Моя база данных с карточками: Имейте ввиду, я зделал больше чем требуется в Google, описав все начиная с assembler и заканчивая Python с машиным обучением и статистикой.
Заметка о карточках: в первый раз вы сразу вспомните ответ, но не помечайте эту карточку как изученную. Нужно просмотреть много раз карточку и ответить правильно прежде чем вы действительно ее запомните. Повторение позволяет мозгу надолго запомнить материал.
В качестве альтернативы вы можете использовать сайт Anki, который мне рекомендовали много раз. Он использует систему повторений для того что бы помочь вам запомнить. Это ресурс user-friendly, доступен на всех платформах и имеет возможность синхронизации с облаком. На платформе iOS стоит 25$ на других бесплатный.
Моя база данных в формате Anki: https://ankiweb.net/shared/info/25173560 (спасибо @xiewenya)
У меня постоянно с собой шпаргалки по ASCII, стеку OSI, Big-O нотации и другим темам. Я повторяю их когда у меня есть свободное время.
Делай перерывы от программирования на пол часа и повторяй свои карточки.
Есть много отвлекающих факторов, на которые тратится время. Сосредотачиваться и концентрироваться сложно.
Это список персональных тем, взятых из заметок Google по подготовке к собеседованию. Это распространенные технологии, но они не встречаются в других ресурсах:
- SQL
- JavaScript
- HTML, CSS и другие front-end технологии
Для изучения некоторых тем требуется один день, для других несколько. Некоторые нужно только изучить и не нужно программировать.
Каждый день я беру одну тему из списка ниже, смотрю видео на эту тему и программирую, используя пройденный материал:
- C - используя структуры и функции, которые в качестве аргументов принимают указатель на структуру или что-нибудь еще.
- C++ - без использования встроенных типов
- C++ - используя встроенные типы, такие как std::list для связанного списка
- Python - используя встроенные типы (для практики на Python)
- написание тестов для проверки правильности кода, иногда просто используя выражение assert()
- Вы можете программировать на Java или других языках, это только лишь мой выбор.
Вам не нужны все эти языки для собеседования, нужен только один один язык для собеседования.
Зачем нужно программировать на нескольких языках:
- Практика, практика, практика пока это не надоедает мне я программирую
- Работа в рамках установленных ограничений (выделение/освобождение памяти без помощи сборщика мусора (кроме Python))
- Используйте встроенные типы, потому как у меня есть опыт использования встроенных инструментах в реальных проектах (нет смысла в написание своей реализации связанного списка для продакшена)
У меня может и не будет времени на все это, но я попробую.
Вы можете посмотреть на мой код тут:
- [C] (https://github.com/jwasham/practice-c)
- [C++] (https://github.com/jwasham/practice-cpp)
- [Python] (https://github.com/jwasham/practice-python)
Вам не нужно запоминать внутренности каждого алгоритма.
Пишите код на доске или листе бумаги, но не компьютере. Проверяйте на простых входных данных. Затем тестируйте на компьютере.
-
Изучайте C
- С используется везде. Вы встретите примеры в книгах, лекциях, видео, везде, пока вы будите учиться.
- Язык программирования С, Vol 2
- Это не большая книга, но после ее прочтения вы получите необходимые знания по С и если будите практиковать, то достаточно быстро его освоите. Понимание С поможет вам понять как программы и память работают.
- ответы на вопросы
-
Как компьютеры выполняют программу:
-
ничего не реализовывать
-
Big O нотация (и Omega и Theta) - лучшее математическое объяснение (video)
-
Skiena:
-
TopCoder (включая рекуррентные соотношений и основную теорему):
-
Если в некоторых лекциях слишком много математики, вы можете ниже найти и посмотреть лекции по дискретной математике для получения базовых знаний.
-
- Реализация динамического вектора.
- Описание:
- Реализация вектора (изменяемый массив с автоматическим изменением размера):
- Тренируйтесь программировать используя массивы, указатели и арифметику указателей для перехода к индексу вместо индексации.
- выделение памяти для массива
- можно выделить память для массива целых чисел, просто не используя его возможности
- начиная с 16, или если начальная цифра больше, использовать степень 2 - 16, 32, 64, 128
- size() - количество элементов
- capacity() - количество элементов которое он может содержать
- is_empty()
- at(index) - возвращает элемент по индексу, изменяет размер, если индекс выходит за пределы
- push(item)
- insert(index, item) - вставка элемента по индексу, сдвигает значение по индексу и следующие за ним элементы вправо
- prepend(item) - может вставить элемент выше индекса 0
- pop() - удалить последний элемент, вернуть значение
- delete(index) - удаляет элемент по индексу, сдвигает все следующие за ним элементы в лево
- remove(item) - ищет элементы по значению и удаляет их, даже если их несколько
- find(item) - ищет элемент по значению и возвращает индекс первого найденного элемента, возвращает -1 если ничего не найденно
- resize(new_capacity) // private function
- когда массив полностью заполнен, увеличивает его размер вдвое
- при добавлении элемента, если размер массива 1/4 от общего размера, увеличиваем на половину
- Время
- O(1) для операций add/remove в конце (амортизируется для размещения большего объема), index, или update
- O(n) для insert/remove в любом месте
- Работа с памятью
- смежные в памяти, это помогает повысить производительность
- необходимое пространство = (размер массива, который >= n) * размер элемента, но даже если 2n, по прежнему O(n)
-
- Описание:
- C Code (video) - не все видео целиком, только кусочки об узлах и распределении памяти.
- Связные списки vs Массивы:
- why you should avoid linked lists (video)
- Ага, попался: тебе нужны знания указетелей на указатели: (для тех случаев, когда ты передаешь указатель функции, которая может менять адрес, куда указывает указатель) Это страница просто для того, чтобы понять указатели на указатели. Читабельность и обслуживаемость страдает из-за искусность.
- воплотить в жизнь (я сделал это с помощью указателя на хвост и без):
- size() - возвращает количество элементов в листе
- empty() - возвращет true если список пуст
- value_at(n) - возращет значение n-го элемента, где 0 - первый элемент
- push_front(value) - добавляет элемент в начало списка
- pop_front() - удаляет первый и возращает его значение
- push_back(value) - добавляет элемент в конец списка
- pop_back() - удаляет последний и возращает его значение
- front() - возращает значение первого элемента в списке
- back() - возращает значение последнего элемента в списке
- insert(index, value) - помещает значение (value) в элемент по индексу (index), при этом заменяемый элемент добавлен в список как новый элемент
- erase(index) - удаляет узел (элемент) по данному индексу
- value_n_from_end(n) - возращает значение n-го элемента c конца списка
- reverse() - реверсирует весь список
- remove_value(value) - удаляет первый элемент в списке с указанным значением (value)
- Двусвязный список
- Описание (video)
- Можно не делать
-
- Стек (video)
- Использование стека Last-In First-Out (video)
- Не будет реализован. Реализация с помощью массива очевидна.
-
- Использование очереди First-In First-Out(video)
- Очередь (video)
- Circular buffer/FIFO
- Очередь с приоритетом (video)
- Реализация с использованием связанного списка и указателя на последний элемент(tail):
- enqueue(value) - добавляет элемент в конец очереди
- dequeue() - возвращает значение и удаляет из очереди последний добавленный элемент(front)
- empty()
- Реализация с приминением массива фиксированного размера:
- enqueue(value) - добавляет элемент в конец очереди
- dequeue() - возвращает значение и удаляет из очереди последний добавленный элемент
- empty()
- full()
- Затраты:
- плохая реализация с приминением связанного списка когда элемент добавляется в начало очереди и удаляется с конца очереди за O(n), операция dequeue в таком случае будет требовать каждый раз обхода всего списка
- enqueue: O(1) (amortized, связанный список и массив [probing])
- dequeue: O(1) (связанный список и массив)
- empty: O(1) (связанный список и массив)
-
-
Видео:
-
Онлайн курсы:
-
реализация с помощью массива и приминением linear probing
- hash(k, m) - m размер хеш-таблицы
- add(key, value) - если ключ уже существует обновляем значение
- exists(key)
- get(key)
- remove(key)
-
-
- Binary Search (video)
- Binary Search (video)
- detail
- Реализация:
- бинарный поиск (на отсортированном числовом массиве)
- бинарный поиск с использованием рекурсии
-
- Bits cheat sheet - you should know many of the powers of 2 from (2^1 to 2^16 and 2^32)
- Даст отличное понимание манипуляции битами с помощью: &, |, ^, ~, >>, <<
- 2s и 1s дополнения:
- счетчик битов:
- округление до следующей степени 2:
- обмен значениями:
- абсолютные значения:
-
- Series: Core Trees (video)
- Series: Trees (video)
- basic tree construction
- traversal
- manipulation algorithms
- BFS (breadth-first search)
- MIT (video)
- level order (BFS, using queue) time complexity: O(n) space complexity: best: O(1), worst: O(n/2)=O(n)
- DFS (depth-first search)
- MIT (video)
- notes: time complexity: O(n) space complexity: best: O(log n) - avg. height of tree worst: O(n)
- inorder (DFS: left, self, right)
- postorder (DFS: left, right, self)
- preorder (DFS: self, left, right)
-
- Binary Search Tree Review (video)
- Series (video)
- starts with symbol table and goes through BST applications
- Introduction (video)
- MIT (video)
- C/C++:
- Binary search tree - Implementation in C/C++ (video)
- BST implementation - memory allocation in stack and heap (video)
- Find min and max element in a binary search tree (video)
- Find height of a binary tree (video)
- Binary tree traversal - breadth-first and depth-first strategies (video)
- Binary tree: Level Order Traversal (video)
- Binary tree traversal: Preorder, Inorder, Postorder (video)
- Check if a binary tree is binary search tree or not (video)
- Delete a node from Binary Search Tree (video)
- Inorder Successor in a binary search tree (video)
- Implement:
- insert // insert value into tree
- get_node_count // get count of values stored
- print_values // prints the values in the tree, from min to max
- delete_tree
- is_in_tree // returns true if given value exists in the tree
- get_height // returns the height in nodes (single node's height is 1)
- get_min // returns the minimum value stored in the tree
- get_max // returns the maximum value stored in the tree
- is_binary_search_tree
- delete_value
- get_successor // returns next-highest value in tree after given value, -1 if none
-
- visualized as a tree, but is usually linear in storage (array, linked list)
- Heap
- Introduction (video)
- Naive Implementations (video)
- Binary Trees (video)
- Tree Height Remark (video)
- Basic Operations (video)
- Complete Binary Trees (video)
- Pseudocode (video)
- Heap Sort - jumps to start (video)
- Heap Sort (video)
- Building a heap (video)
- MIT: Heaps and Heap Sort (video)
- CS 61B Lecture 24: Priority Queues (video)
- Linear Time BuildHeap (max-heap)
- Implement a max-heap:
- insert
- sift_up - needed for insert
- get_max - returns the max item, without removing it
- get_size() - return number of elements stored
- is_empty() - returns true if heap contains no elements
- extract_max - returns the max item, removing it
- sift_down - needed for extract_max
- remove(i) - removes item at index x
- heapify - create a heap from an array of elements, needed for heap_sort
- heap_sort() - take an unsorted array and turn it into a sorted array in-place using a max heap
- note: using a min heap instead would save operations, but double the space needed (cannot do in-place).
-
Notes:
- Implement sorts & know best case/worst case, average complexity of each:
- no bubble sort - it's terrible - O(n^2), except when n <= 16
- stability in sorting algorithms ("Is Quicksort stable?")
- Which algorithms can be used on linked lists? Which on arrays? Which on both?
- I wouldn't recommend sorting a linked list, but merge sort is doable.
- Merge Sort For Linked List
- Implement sorts & know best case/worst case, average complexity of each:
-
For heapsort, see Heap data structure above. Heap sort is great, but not stable.
-
UC Berkeley:
-
Merge sort code:
-
Quick sort code:
-
Implement:
- Mergesort: O(n log n) average and worst case
- Quicksort O(n log n) average case
- Selection sort and insertion sort are both O(n^2) average and worst case
- For heapsort, see Heap data structure above.
-
Not required, but I recommended them:
If you need more detail on this subject, see "Sorting" section in Additional Detail on Some Subjects
Графы могут быть использованы для представления многих задач в области CS, поэтому раздел включает в себя такие темы как деревья и сортировку.
-
Заметки от Стива Йеги:
- Существуют три основных способа представления графа в памяти:
- объекты и указатели
- матрица
- список смежности
- Ознакомьтесь с каждым представлением, его преимуществами и недостатками
- BFS и DFS - узнайте их вычислительную сложность, соотношение преимуществ и недостатков, способы реализации в коде
- Когда вы получили задачу, в первую очередь попробуйте построить свое решение с использованием графов, а затем двигайтесь дальше, если такого решения нет.
- Существуют три основных способа представления графа в памяти:
-
Лекции профессора Стивена Скина - хорошее введение:
- CSE373 2012 - Лекция 11 - Структуры данных для представления графов (видео)
- CSE373 2012 - Лекция 12 - Поиск в ширину (видео)
- CSE373 2012 - Лекция 13 - Алгоритмы на графах (видео)
- CSE373 2012 - Лекция 14 - Алгоритмы на графах (продолжение) (видео)
- CSE373 2012 - Лекция 15 - Алгоритмы на графах (продолжение 2) (видео)
- CSE373 2012 - Лекция 16 - Алгоритмы на графах (продолжение 3) (видео)
-
Графы (обзор и многое другое):
- 6.006 Задача поиска кратчайших путей из одной вершины (видео)
- 6.006 Алгоритм Дейкстры (видео)
- 6.006 Алгоритм Беллмана-Форда (видео)
- 6.006 Оптимизация алгоритма Дейкстры (видео)
- Aduni: Алгоритмы на графах I: Топологическая сортировка, Минимальное остовное дерево, Алгоритм Прима - Лекция 6 (видео)
- Aduni: Алгоритмы на графах II: DFS, BFS, Алгоритм Краскала, Система непересекающихся множеств - Лекция 7 (видео)
- Aduni: Алгоритмы на графах III: Кратчайший путь - Лекция 8 (видео)
- Aduni: Алгоритмы на графах IV: Введение в геометрические алгоритмы - Лекция 9 (видео)
- CS 61B 2014 (начиная с 58:09) (видео)
- CS 61B 2014: Взвешенные графы (видео)
- Жадные алгоритмы: Минимальное остовное дерево (видео)
- Сильно связные компоненты, Алгоритм Косарайю, Алгоритмы на графах (видео)
-
Полный курс на Coursera:
-
Стив Йеги: Если у вас есть возможность, попробуйте изучить более продвинутые алгоритмы:
- Алгоритм Дейкстры - смотри выше - 6.006
- A*
-
Я смогу применить:
- DFS со списком смежности (рекурсия)
- DFS со списком смежности (итерационный подход со стеком)
- DFS с матрицей смежности (рекурсия)
- DFS с матрицей смежности (итерационный подход со стеком)
- BFS со списком смежности
- BFS с матрицей смежности
- Поиск кратчайшего пути из одной вершины (алгоритм Дейкстры)
- Минимальное остовное дерево
- Алгоритмы основанные на DFS (см видео Aduni выше):
- Поиск циклов в графе (необходимо для топологической сортировки, так как мы проверяем наличие циклов в графе перед началом работы алгоритма)
- топологическую сортировку
- подсчет компонентов связности в графе
- список сильно связных компонентов
- проверку графа на двудольность
Вы найдете больше практических задач на графах в книге Стивена Скина (см раздел книги ниже) и в книгах о прохождении интервью.
-
- Лекции Стэнфорда по рекурсии и механизмам возврата:
- когда уместно использование рекурсии?
- когда лучше использовать хвостовую рекурсию?
-
- Дополнительно: Серия уроков по UML 2.0 (видео)
- Объектно-ориентированная разработка программного обеспечения: Разработка программного обеспечения с использованием UML и Java (21 видео):
- Можно пропустить эту часть, если у вас есть хорошее понимание концепции ООП и практик проектирования.
- ООП: Разработка программного обеспечения с использованием UML и Java
- Принципы дизайна ООП (SOLID):
- Боб Мартин SOLID принципы объектно-ориентированного программирования и гибкое проектирование (видео)
- Шаблоны проектирования SOLID в C# (видео)
- Принципы SOLID (видео)
- S - Принцип единственной ответственности | Одна зона ответственности для каждого объекта
- O - Принцип открытости/закрытости | Программные сущности должны быть готовы для расширения, но не для модификации
- L - Принцип подстановки Барбары Лисков | Функции, которые используют ссылки на базовые классы, должны иметь возможность использовать объекты производных классов, не зная об этом
- I - Принцип разделения интерфейса | Клиенты не должны быть вынуждены реализовывать интерфейсы, которые они не используют
- D -Принцип инверсии зависимостей | Снизить зависимость в составе объектов
-
- Краткий обзор UML (видео)
- Изучите эти шаблоны:
- стратегия
- одиночка
- адаптер
- прототип
- декоратор
- посетитель
- фабричный метод, абстрактная фабрика
- фасад
- наблюдатель
- заместитель
- делегирование
- команда
- состояние
- хранитель
- итератор
- компоновщик
- приспособленец
- Глава 6 (Часть 1) - Паттерны (видео)
- Глава 6 (Часть 2) - Абстрактное представление, Общая иерархия, Актер – Роль, Одиночка, Наблюдатель, Делегирование (видео)
- Глава 6 (Часть 3) - Адаптер, Фасад, Неизменяемый объект, интерфейс типа read-only, Заместитель (видео)
- Серия уроков (27 видео)
- Паттерны проектирования
- Я знаю, что классической книгой для изучения паттернов является "Приемы объектно-ориентированного проектирования. Паттерны проектирования" (Джон Влиссидес, Ральф Джонсон, Ричард Хелм, Эрих Гамма), но "Паттерны проектирования" отлично подходят для тех, кто только начал изучать ООП.
- Удобный справочник: 101 шаблон проектирования и советы для разработчиков
-
- Math Skills: How to find Factorial, Permutation and Combination (Choose) (video)
- Make School: Probability (video)
- Make School: More Probability and Markov Chains (video)
- Khan Academy:
- Course layout:
- Just the videos - 41 (each are simple and each are short):
-
- Know about the most famous classes of NP-complete problems, such as traveling salesman and the knapsack problem, and be able to recognize them when an interviewer asks you them in disguise.
- Know what NP-complete means.
- Computational Complexity (video)
- Simonson:
- Skiena:
- Complexity: P, NP, NP-completeness, Reductions (video)
- Complexity: Approximation Algorithms (video)
- Complexity: Fixed-Parameter Algorithms (video)
- Peter Norvig discusses near-optimal solutions to traveling salesman problem:
- Pages 1048 - 1140 in CLRS if you have it.
-
- Computer Science 162 - Operating Systems (25 videos):
- for processes and threads see videos 1-11
- Operating Systems and System Programming (video)
- What Is The Difference Between A Process And A Thread?
- Covers:
- Processes, Threads, Concurrency issues
- difference between processes and threads
- processes
- threads
- locks
- mutexes
- semaphores
- monitors
- how they work
- deadlock
- livelock
- CPU activity, interrupts, context switching
- Modern concurrency constructs with multicore processors
- Process resource needs (memory: code, static storage, stack, heap, and also file descriptors, i/o)
- Thread resource needs (shares above (minus stack) with other threads in the same process but each has its own pc, stack counter, registers, and stack)
- Forking is really copy on write (read-only) until the new process writes to memory, then it does a full copy.
- Context switching
- How context switching is initiated by the operating system and underlying hardware
- Processes, Threads, Concurrency issues
- threads in C++ (series - 10 videos)
- concurrency in Python (videos):
- Computer Science 162 - Operating Systems (25 videos):
-
- These are Google papers and well-known papers.
- Reading all from end to end with full comprehension will likely take more time than you have. I recommend being selective on papers and their sections.
- 1978: Communicating Sequential Processes
- 2003: The Google File System
- replaced by Colossus in 2012
- 2004: MapReduce: Simplified Data Processing on Large Clusters
- mostly replaced by Cloud Dataflow?
- 2007: What Every Programmer Should Know About Memory (very long, and the author encourages skipping of some sections)
- 2012: Google's Colossus
- paper not available
- 2012: AddressSanitizer: A Fast Address Sanity Checker:
- 2013: Spanner: Google’s Globally-Distributed Database:
- 2014: Machine Learning: The High-Interest Credit Card of Technical Debt
- 2015: Continuous Pipelines at Google
- 2015: High-Availability at Massive Scale: Building Google’s Data Infrastructure for Ads
- 2015: TensorFlow: Large-Scale Machine Learning on Heterogeneous Distributed Systems
- 2015: How Developers Search for Code: A Case Study
- 2016: Borg, Omega, and Kubernetes
-
- To cover:
- how unit testing works
- what are mock objects
- what is integration testing
- what is dependency injection
- Agile Software Testing with James Bach (video)
- Open Lecture by James Bach on Software Testing (video)
- Steve Freeman - Test-Driven Development (that’s not what we meant) (video)
- TDD is dead. Long live testing.
- Is TDD dead? (video)
- Video series (152 videos) - not all are needed (video)
- Test-Driven Web Development with Python
- Dependency injection:
- How to write tests
- To cover:
-
- in an OS, how it works
- can be gleaned from Operating System videos
-
- understand what lies beneath the programming APIs you use
- can you implement them?
-
- Sedgewick - Suffix Arrays (video)
- Sedgewick - Substring Search (videos)
- Search pattern in text (video)
If you need more detail on this subject, see "String Matching" section in Additional Detail on Some Subjects
- You can expect system design questions if you have 4+ years of experience.
- Scalability and System Design are very large topics with many topics and resources, since there is a lot to consider when designing a software/hardware system that can scale. Expect to spend quite a bit of time on this.
- Considerations from Yegge:
- scalability
- Distill large data sets to single values
- Transform one data set to another
- Handling obscenely large amounts of data
- system design
- features sets
- interfaces
- class hierarchies
- designing a system under certain constraints
- simplicity and robustness
- tradeoffs
- performance analysis and optimization
- scalability
- START HERE: System Design from HiredInTech
- How Do I Prepare To Answer Design Questions In A Technical Inverview?
- 8 Things You Need to Know Before a System Design Interview
- Algorithm design
- Database Normalization - 1NF, 2NF, 3NF and 4NF (video)
- System Design Interview - There are a lot of resources in this one. Look through the articles and examples. I put some of them below.
- How to ace a systems design interview
- Numbers Everyone Should Know
- How long does it take to make a context switch?
- Transactions Across Datacenters (video)
- A plain English introduction to CAP Theorem
- Paxos Consensus algorithm:
- Consistent Hashing
- NoSQL Patterns
- Scalability:
- Great overview (video)
- Short series:
- Scalable Web Architecture and Distributed Systems
- Fallacies of Distributed Computing Explained
- Pragmatic Programming Techniques
- Jeff Dean - Building Software Systems At Google and Lessons Learned (video)
- Introduction to Architecting Systems for Scale
- Scaling mobile games to a global audience using App Engine and Cloud Datastore (video)
- How Google Does Planet-Scale Engineering for Planet-Scale Infra (video)
- The Importance of Algorithms
- Sharding
- Scale at Facebook (2009)
- Scale at Facebook (2012), "Building for a Billion Users" (video)
- Engineering for the Long Game - Astrid Atkinson Keynote(video)
- 7 Years Of YouTube Scalability Lessons In 30 Minutes
- How PayPal Scaled To Billions Of Transactions Daily Using Just 8VMs
- How to Remove Duplicates in Large Datasets
- A look inside Etsy's scale and engineering culture with Jon Cowie (video)
- What Led Amazon to its Own Microservices Architecture
- To Compress Or Not To Compress, That Was Uber's Question
- Asyncio Tarantool Queue, Get In The Queue
- When Should Approximate Query Processing Be Used?
- Google's Transition From Single Datacenter, To Failover, To A Native Multihomed Architecture
- Spanner
- Egnyte Architecture: Lessons Learned In Building And Scaling A Multi Petabyte Distributed System
- Machine Learning Driven Programming: A New Programming For A New World
- The Image Optimization Technology That Serves Millions Of Requests Per Day
- A Patreon Architecture Short
- Tinder: How Does One Of The Largest Recommendation Engines Decide Who You'll See Next?
- Design Of A Modern Cache
- Live Video Streaming At Facebook Scale
- A Beginner's Guide To Scaling To 11 Million+ Users On Amazon's AWS
- How Does The Use Of Docker Effect Latency?
- Does AMP Counter An Existential Threat To Google?
- A 360 Degree View Of The Entire Netflix Stack
- Latency Is Everywhere And It Costs You Sales - How To Crush It
- Serverless (very long, just need the gist)
- What Powers Instagram: Hundreds of Instances, Dozens of Technologies
- Cinchcast Architecture - Producing 1,500 Hours Of Audio Every Day
- Justin.Tv's Live Video Broadcasting Architecture
- Playfish's Social Gaming Architecture - 50 Million Monthly Users And Growing
- TripAdvisor Architecture - 40M Visitors, 200M Dynamic Page Views, 30TB Data
- PlentyOfFish Architecture
- Salesforce Architecture - How They Handle 1.3 Billion Transactions A Day
- ESPN's Architecture At Scale - Operating At 100,000 Duh Nuh Nuhs Per Second
- See "Messaging, Serialization, and Queueing Systems" way below for info on some of the technologies that can glue services together
- Twitter:
- For even more, see "Mining Massive Datasets" video series in the Video Series section.
- Practicing the system design process: Here are some ideas to try working through on paper, each with some documentation on how it was handled in the real world:
- review: System Design from HiredInTech
- cheat sheet
- flow:
- Understand the problem and scope:
- define the use cases, with interviewer's help
- suggest additional features
- remove items that interviewer deems out of scope
- assume high availability is required, add as a use case
- Think about constraints:
- ask how many requests per month
- ask how many requests per second (they may volunteer it or make you do the math)
- estimate reads vs. writes percentage
- keep 80/20 rule in mind when estimating
- how much data written per second
- total storage required over 5 years
- how much data read per second
- Abstract design:
- layers (service, data, caching)
- infrastructure: load balancing, messaging
- rough overview of any key algorithm that drives the service
- consider bottlenecks and determine solutions
- Understand the problem and scope:
- Exercises:
- Design a CDN network: old article
- Design a random unique ID generation system
- Design an online multiplayer card game
- Design a key-value database
- Design a function to return the top k requests during past time interval
- Design a picture sharing system
- Design a recommendation system
- Design a URL-shortener system: copied from above
- Design a cache system
This section will have shorter videos that can you watch pretty quickly to review most of the important concepts.
It's nice if you want a refresher often.
- Series of 2-3 minutes short subject videos (23 videos)
- Series of 2-5 minutes short subject videos - Michael Sambol (18 videos):
- Sedgewick Videos - Algorithms I
- Sedgewick Videos - Algorithms II
Now that you know all the computer science topics above, it's time to practice answering coding problems.
Coding question practice is not about memorizing answers to programming problems.
Why you need to practice doing programming problems:
- problem recognition, and where the right data structures and algorithms fit in
- gathering requirements for the problem
- talking your way through the problem like you will in the interview
- coding on a whiteboard or paper, not a computer
- coming up with time and space complexity for your solutions
- testing your solutions
There is a great intro for methodical, communicative problem solving in an interview. You'll get this from the programming interview books, too, but I found this outstanding: Algorithm design canvas
My Process for Coding Interview (Book) Exercises
No whiteboard at home? That makes sense. I'm a weirdo and have a big whiteboard. Instead of a whiteboard, pick up a large drawing pad from an art store. You can sit on the couch and practice. This is my "sofa whiteboard". I added the pen in the photo for scale. If you use a pen, you'll wish you could erase. Gets messy quick.
Supplemental:
- Mathematics for Topcoders
- Dynamic Programming – From Novice to Advanced
- MIT Interview Materials
- Exercises for getting better at a given language
Read and Do Programming Problems (in this order):
- Programming Interviews Exposed: Secrets to Landing Your Next Job, 2nd Edition
- answers in C, C++ and Java
- Cracking the Coding Interview, 6th Edition
- answers in Java
See Book List above
Once you've learned your brains out, put those brains to work. Take coding challenges every day, as many as you can.
Challenge sites:
- LeetCode
- TopCoder
- Project Euler (math-focused)
- Codewars
- HackerRank
- Codility
- InterviewCake
- Geeks for Geeks
- InterviewBit
Maybe:
- Cracking The Coding Interview Set 2 (videos):
- Ten Tips for a (Slightly) Less Awful Resume
- See Resume prep items in Cracking The Coding Interview and back of Programming Interviews Exposed
Think of about 20 interview questions you'll get, along with the lines of the items below. Have 2-3 answers for each. Have a story, not just data, about something you accomplished.
- Why do you want this job?
- What's a tough problem you've solved?
- Biggest challenges faced?
- Best/worst designs seen?
- Ideas for improving an existing Google product.
- How do you work best, as an individual and as part of a team?
- Which of your skills or experiences would be assets in the role and why?
- What did you most enjoy at [job x / project y]?
- What was the biggest challenge you faced at [job x / project y]?
- What was the hardest bug you faced at [job x / project y]?
- What did you learn at [job x / project y]?
- What would you have done better at [job x / project y]?
Some of mine (I already may know answer to but want their opinion or team perspective):
- How large is your team?
- What does your dev cycle look like? Do you do waterfall/sprints/agile?
- Are rushes to deadlines common? Or is there flexibility?
- How are decisions made in your team?
- How many meetings do you have per week?
- Do you feel your work environment helps you concentrate?
- What are you working on?
- What do you like about it?
- What is the work life like?
Congratulations!
Keep learning.
You're never really done.
*****************************************************************************************************
*****************************************************************************************************
Everything below this point is optional. These are my recommendations, not Google's.
By studying these, you'll get greater exposure to more CS concepts, and will be better prepared for
any software engineering job. You'll be a much more well-rounded software engineer.
*****************************************************************************************************
*****************************************************************************************************
- The Unix Programming Environment
- an oldie but a goodie
- The Linux Command Line: A Complete Introduction
- a modern option
- TCP/IP Illustrated Series
- Head First Design Patterns
- a gentle introduction to design patterns
- Design Patterns: Elements of Reusable Object-Oriented Software
- aka the "Gang Of Four" book, or GOF
- the canonical design patterns book
- Site Reliability Engineering
- UNIX and Linux System Administration Handbook, 4th Edition
-
- This subject can be pretty difficult, as each DP soluble problem must be defined as a recursion relation, and coming up with it can be tricky.
- I suggest looking at many examples of DP problems until you have a solid understanding of the pattern involved.
- Videos:
- the Skiena videos can be hard to follow since he sometimes uses the whiteboard, which is too small to see
- Skiena: CSE373 2012 - Lecture 19 - Introduction to Dynamic Programming (video)
- Skiena: CSE373 2012 - Lecture 20 - Edit Distance (video)
- Skiena: CSE373 2012 - Lecture 21 - Dynamic Programming Examples (video)
- Skiena: CSE373 2012 - Lecture 22 - Applications of Dynamic Programming (video)
- Simonson: Dynamic Programming 0 (starts at 59:18) (video)
- Simonson: Dynamic Programming I - Lecture 11 (video)
- Simonson: Dynamic programming II - Lecture 12 (video)
- List of individual DP problems (each is short): Dynamic Programming (video)
- Yale Lecture notes:
- Coursera:
-
- Big And Little Endian
- Big Endian Vs Little Endian (video)
- Big And Little Endian Inside/Out (video)
- Very technical talk for kernel devs. Don't worry if most is over your head.
- The first half is enough.
-
- suggested by Yegge, from an old Amazon recruiting post: Familiarize yourself with a unix-based code editor
- vi(m):
- emacs:
-
- Khan Academy
- more about Markov processes:
- See more in MIT 6.050J Information and Entropy series below.
-
- Intro
- Parity
- Hamming Code:
- Error Checking
-
- also see videos below
- make sure to watch information theory videos first
- Information Theory, Claude Shannon, Entropy, Redundancy, Data Compression & Bits (video)
-
- also see videos below
- make sure to watch information theory videos first
- Khan Academy Series
- Cryptography: Hash Functions
- Cryptography: Encryption
-
- make sure to watch information theory videos first
- Computerphile (videos):
- Compressor Head videos
- (optional) Google Developers Live: GZIP is not enough!
-
- if you have networking experience or want to be a systems engineer, expect questions
- otherwise, this is just good to know
- Khan Academy
- UDP and TCP: Comparison of Transport Protocols
- TCP/IP and the OSI Model Explained!
- Packet Transmission across the Internet. Networking & TCP/IP tutorial.
- HTTP
- SSL and HTTPS
- SSL/TLS
- HTTP 2.0
- Video Series (21 videos)
- Subnetting Demystified - Part 5 CIDR Notation
-
- Given a Bloom filter with m bits and k hashing functions, both insertion and membership testing are O(k)
- Bloom Filters
- Bloom Filters | Mining of Massive Datasets | Stanford University
- Tutorial
- How To Write A Bloom Filter App
-
- used to determine the similarity of documents
- the opposite of MD5 or SHA which are used to determine if 2 documents/strings are exactly the same.
- Simhashing (hopefully) made simple
-
- Note there are different kinds of tries. Some have prefixes, some don't, and some use string instead of bits to track the path.
- I read through code, but will not implement.
- Sedgewick - Tries (3 videos)
- Notes on Data Structures and Programming Techniques
- Short course videos:
- The Trie: A Neglected Data Structure
- TopCoder - Using Tries
- Stanford Lecture (real world use case) (video)
- MIT, Advanced Data Structures, Strings (can get pretty obscure about halfway through)
-
-
Know least one type of balanced binary tree (and know how it's implemented):
-
"Among balanced search trees, AVL and 2/3 trees are now passé, and red-black trees seem to be more popular. A particularly interesting self-organizing data structure is the splay tree, which uses rotations to move any accessed key to the root." - Skiena
-
Of these, I chose to implement a splay tree. From what I've read, you won't implement a balanced search tree in your interview. But I wanted exposure to coding one up and let's face it, splay trees are the bee's knees. I did read a lot of red-black tree code.
- splay tree: insert, search, delete functions If you end up implementing red/black tree try just these:
- search and insertion functions, skipping delete
-
I want to learn more about B-Tree since it's used so widely with very large data sets.
-
AVL trees
- In practice: From what I can tell, these aren't used much in practice, but I could see where they would be: The AVL tree is another structure supporting O(log n) search, insertion, and removal. It is more rigidly balanced than red–black trees, leading to slower insertion and removal but faster retrieval. This makes it attractive for data structures that may be built once and loaded without reconstruction, such as language dictionaries (or program dictionaries, such as the opcodes of an assembler or interpreter).
- MIT AVL Trees / AVL Sort (video)
- AVL Trees (video)
- AVL Tree Implementation (video)
- Split And Merge
-
Splay trees
- In practice: Splay trees are typically used in the implementation of caches, memory allocators, routers, garbage collectors, data compression, ropes (replacement of string used for long text strings), in Windows NT (in the virtual memory, networking and file system code) etc.
- CS 61B: Splay Trees (video)
- MIT Lecture: Splay Trees:
- Gets very mathy, but watch the last 10 minutes for sure.
- Video
-
Red/black trees
- these are a translation of a 2-3 tree (see below)
- In practice: Red–black trees offer worst-case guarantees for insertion time, deletion time, and search time. Not only does this make them valuable in time-sensitive applications such as real-time applications, but it makes them valuable building blocks in other data structures which provide worst-case guarantees; for example, many data structures used in computational geometry can be based on red–black trees, and the Completely Fair Scheduler used in current Linux kernels uses red–black trees. In the version 8 of Java, the Collection HashMap has been modified such that instead of using a LinkedList to store identical elements with poor hashcodes, a Red-Black tree is used.
- Aduni - Algorithms - Lecture 4 (link jumps to starting point) (video)
- Aduni - Algorithms - Lecture 5 (video)
- Black Tree
- An Introduction To Binary Search And Red Black Tree
-
2-3 search trees
- In practice: 2-3 trees have faster inserts at the expense of slower searches (since height is more compared to AVL trees).
- You would use 2-3 tree very rarely because its implementation involves different types of nodes. Instead, people use Red Black trees.
- 23-Tree Intuition and Definition (video)
- Binary View of 23-Tree
- 2-3 Trees (student recitation) (video)
-
2-3-4 Trees (aka 2-4 trees)
- In practice: For every 2-4 tree, there are corresponding red–black trees with data elements in the same order. The insertion and deletion operations on 2-4 trees are also equivalent to color-flipping and rotations in red–black trees. This makes 2-4 trees an important tool for understanding the logic behind red–black trees, and this is why many introductory algorithm texts introduce 2-4 trees just before red–black trees, even though 2-4 trees are not often used in practice.
- CS 61B Lecture 26: Balanced Search Trees (video)
- Bottom Up 234-Trees (video)
- Top Down 234-Trees (video)
-
N-ary (K-ary, M-ary) trees
- note: the N or K is the branching factor (max branches)
- binary trees are a 2-ary tree, with branching factor = 2
- 2-3 trees are 3-ary
- K-Ary Tree
-
B-Trees
- fun fact: it's a mystery, but the B could stand for Boeing, Balanced, or Bayer (co-inventor)
- In Practice: B-Trees are widely used in databases. Most modern filesystems use B-trees (or Variants). In addition to its use in databases, the B-tree is also used in filesystems to allow quick random access to an arbitrary block in a particular file. The basic problem is turning the file block i address into a disk block (or perhaps to a cylinder-head-sector) address.
- B-Tree
- Introduction to B-Trees (video)
- B-Tree Definition and Insertion (video)
- B-Tree Deletion (video)
- MIT 6.851 - Memory Hierarchy Models (video) - covers cache-oblivious B-Trees, very interesting data structures - the first 37 minutes are very technical, may be skipped (B is block size, cache line size)
-
-
- great for finding number of points in a rectangle or higher dimension object
- a good fit for k-nearest neighbors
- Kd Trees (video)
- kNN K-d tree algorithm (video)
-
- "These are somewhat of a cult data structure" - Skiena
- Randomization: Skip Lists (video)
- For animations and a little more detail
-
- Combination of a binary search tree and a heap
- Treap
- Data Structures: Treaps explained (video)
- Applications in set operations
-
- see videos below
-
- Why ML?
- Google's Cloud Machine learning tools (video)
- Google Developers' Machine Learning Recipes (Scikit Learn & Tensorflow) (video)
- Tensorflow (video)
- Tensorflow Tutorials
- Practical Guide to implementing Neural Networks in Python (using Theano)
- Courses:
- Great starter course: Machine Learning - videos only - see videos 12-18 for a review of linear algebra (14 and 15 are duplicates)
- Neural Networks for Machine Learning
- Google's Deep Learning Nanodegree
- Google/Kaggle Machine Learning Engineer Nanodegree
- Self-Driving Car Engineer Nanodegree
- Metis Online Course ($99 for 2 months)
- Resources:
--
I added these to reinforce some ideas already presented above, but didn't want to include them
above because it's just too much. It's easy to overdo it on a subject.
You want to get hired in this century, right?
-
Union-Find
-
More Dynamic Programming (videos)
- 6.006: Dynamic Programming I: Fibonacci, Shortest Paths
- 6.006: Dynamic Programming II: Text Justification, Blackjack
- 6.006: DP III: Parenthesization, Edit Distance, Knapsack
- 6.006: DP IV: Guitar Fingering, Tetris, Super Mario Bros.
- 6.046: Dynamic Programming & Advanced DP
- 6.046: Dynamic Programming: All-Pairs Shortest Paths
- 6.046: Dynamic Programming (student recitation)
-
Advanced Graph Processing (videos)
-
MIT Probability (mathy, and go slowly, which is good for mathy things) (videos):
-
String Matching
- Rabin-Karp (videos):
- Knuth-Morris-Pratt (KMP):
- Boyer–Moore string search algorithm
- Coursera: Algorithms on Strings
- starts off great, but by the time it gets past KMP it gets more complicated than it needs to be
- nice explanation of tries
- can be skipped
-
Sorting
- Stanford lectures on sorting:
- Shai Simonson, Aduni.org:
- Steven Skiena lectures on sorting:
Sit back and enjoy. "Netflix and skill" :P
-
List of individual Dynamic Programming problems (each is short)
-
Excellent - MIT Calculus Revisited: Single Variable Calculus
-
Computer Science 70, 001 - Spring 2015 - Discrete Mathematics and Probability Theory
-
CSE373 - Analysis of Algorithms (25 videos)
-
UC Berkeley CS 152: Computer Architecture and Engineering (20 videos)
-
Carnegie Mellon - Computer Architecture Lectures (39 videos)
-
MIT 6.042J: Mathematics for Computer Science, Fall 2010 (25 videos)
-
MIT 6.050J: Information and Entropy, Spring 2008 (19 videos)