Просмотрел бесплатный курс на Youtube, очень качественно и по делу. Рекомендую всем.
Технологии хранения и обработки больших объёмов данных
Лекции по темам:
1. Распределённые файловые системы
2. Распределённая параллельная обработка данных технологией Map-Reduce
3. Полнотекстовый поиск
4. PageRank и распределённые вычисления на графах
5. NoSQL СУБД. Google Bigtable
6. NoSQL и согласованность. Percolator
7. Достижение согласованности. Алгоритмы консенсуса
8. Поиск похожих документов
9. Алгоритмы кластеризации
10. Google Spanner