Глава 7. Высокопроизводительные pandas и Apache Arrow

Оптимизация памяти и времени при загрузке данных

Сопоставление сжатых и не сжатых данных

Умозаключения о типе столбца

Воздействие точности типа данных

Перекодирование и сокращение данных

Методики для увеличения скорости анализа данных

Применение индексации для ускорения доступа

Стратегии итерации по строкам

pandas поверх NumPy, Cython и NumExpr

Применение NumPy в явном виде

pandas поверх NumExpr

Cython и pandas

Считывание данных в pandas при помощи Arrow

Взаимосвязь между pandas и Apache Arrow

Считывание файла CSV

Анализ с применением Arrow

Применение Arrow Interop для делегирования работы более эффективным языкам и системам

Реализации архитектуры interop языка Arrow

Операции нулевого копирования данных при помощи сервера Plasma Arrow