Глава 7. Высокопроизводительные pandas и Apache Arrow
Содержание
Глава 7. Высокопроизводительные pandas и Apache Arrow
Оптимизация памяти и времени при загрузке данных
Сопоставление сжатых и не сжатых данных
Умозаключения о типе столбца
Воздействие точности типа данных
Перекодирование и сокращение данных
Методики для увеличения скорости анализа данных
Применение индексации для ускорения доступа
Стратегии итерации по строкам
pandas поверх NumPy, Cython и NumExpr
Применение NumPy в явном виде
pandas поверх NumExpr
Cython и pandas
Считывание данных в pandas при помощи Arrow
Взаимосвязь между pandas и Apache Arrow
Считывание файла CSV
Анализ с применением Arrow
Применение Arrow Interop для делегирования работы более эффективным языкам и системам
Реализации архитектуры interop языка Arrow
Операции нулевого копирования данных при помощи сервера Plasma Arrow
Оптимизация памяти и времени при загрузке данных
Сопоставление сжатых и не сжатых данных
Умозаключения о типе столбца
Воздействие точности типа данных
Перекодирование и сокращение данных
Методики для увеличения скорости анализа данных
Применение индексации для ускорения доступа
Стратегии итерации по строкам
pandas поверх NumPy, Cython и NumExpr
Применение NumPy в явном виде
pandas поверх NumExpr
Cython и pandas
Считывание данных в pandas при помощи Arrow
Взаимосвязь между pandas и Apache Arrow
Считывание файла CSV
Анализ с применением Arrow
Применение Arrow Interop для делегирования работы более эффективным языкам и системам
Реализации архитектуры interop языка Arrow
Операции нулевого копирования данных при помощи сервера Plasma Arrow