Ежедневно Facebook обрабатывает по 500 Тбайт пользовательских данных
Процедура сканирования необходима для того, чтобы разработчики Facebook имели возможность получать сведения, например, о популярности той или иной рекламы. Компания должна иметь обратную связь о работоспособности своих программных разработок, чтобы двигаться дальше. Обработка информации в течение нескольких минут позволяет Facebook вывести новый продукт, оценить реакцию пользователей и практически в реальном времени внести необходимые правки. Многие функции Facebook требуют оперативного сканирования данных пользователя в их же интересах. К примеру, это позволяет оперативно предлагать друзей и помещать обновления статусов и новостей и прочее.
В настоящее время Facebook хранит большую часть своих данных в одном Hadoop-кластере объёмом более 100 Пбайт. Для этого используется один центр обработки данных. Для дублирования и других данных используется другой дата-центр. Вице-президент компании Facebook по проектированию инфраструктуры Джей Парих (Jay Parikh) заверил, что они практикуют "политику абсолютной нетерпимости" в отношении некорректного использования данных.
Кстати, сегодня мы уже сообщали о том, что Facebook выпустила новую улучшенную версию мобильного приложения для пользователей Apple iPhone и iPad - Facebook 5.0.