Как установить pandas для python windows

Библиотека pandas в Python — это идеальный инструмент для тех, кто занимается анализом данных, используя для этого язык программирования Python.

В этом материале речь сначала пойдет об основных аспектах библиотеки и о том, как установить ее в систему. Потом вы познакомитесь с двумя структурам данных: series и dataframes. Сможете поработать с базовым набором функций, предоставленных библиотекой pandas, для выполнения основных операций по обработке. Знакомство с ними — ключевой навык для специалиста в этой сфере. Поэтому так важно перечитать материал до тех, пока он не станет понятен на 100%.

А на примерах сможете разобраться с новыми концепциями, появившимися в библиотеке — индексацией структур данных. Научитесь правильно ее использовать для управления данными. В конце концов, разберетесь с тем, как расширить возможности индексации для работы с несколькими уровнями одновременно, используя для этого иерархическую индексацию.

Библиотека Python для анализа данных

Pandas — это библиотека Python с открытым исходным кодом для специализированного анализа данных. Сегодня все, кто использует Python для изучения статистических целей анализа и принятия решений, должны быть с ней знакомы.

Библиотека была спроектирована и разработана преимущественно Уэсом Маккини в 2008 году. В 2012 к нему присоединился коллега Чан Шэ. Вместе они создали одну из самых используемых библиотек в сообществе Python.

Pandas появилась из необходимости в простом инструменте для обработки, извлечения и управления данными.

Этот пакет Python спроектирован на основе библиотеки NumPy. Такой выбор обуславливает успех и быстрое распространение pandas. Он также пользуется всеми преимуществами NumPy и делает pandas совместимой с большинством другим модулей.

Еще одно важное решение — разработка специальных структур для анализа данных. Вместо того, чтобы использовать встроенные в Python или предоставляемые другими библиотеками структуры, были разработаны две новых.

Они спроектированы для работы с реляционными и классифицированными данными, что позволяет управлять данными способом, похожим на тот, что используется в реляционных базах SQL и таблицах Excel.

Дальше вы встретите примеры базовых операций для анализа данных, которые обычно используются на реляционных или таблицах Excel. Pandas предоставляет даже более расширенный набор функций и методов, позволяющих выполнять эти операции эффективнее.

Основная задача pandas — предоставить все строительные блоки для всех, кто погружается в мир анализа данных.

Простейший способ установки библиотеки pandas — использование собранного решения, то есть установка через Anaconda или Enthought.

Установка в Anaconda

В Anaconda установка занимает пару минут. В первую очередь нужно проверить, не установлен ли уже pandas, и если да, то какая это версия. Для этого введите следующую команду в терминале:

conda list pandas

Если модуль уже установлен (например в Windows), вы получите приблизительно следующий результат:

# packages in environment at C:\Users\Fabio\Anaconda: 
# 
pandas 		0.20.3 		py36hce827b7_2

Если pandas не установлена, ее необходимо установить. Введите следующую команду:

conda install pandas

Anaconda тут же проверит все зависимости и установит дополнительные модули.

Solving environment: done
## Package Plan ##
Environment location: C:\Users\Fabio\Anaconda3
added / updated specs:
  - pandas
  The following new packages will be installed:
   Pandas: 0.22.0-py36h6538335_0
Proceed ([y]/n)?
Press the y key on your keyboard to continue the installation.
Preparing transaction: done
Verifying transaction: done
Executing transaction: done

Если требуется обновить пакет до более новой версии, используется эта интуитивная команда:

conda update pandas

Система проверит версию pandas и версию всех модулей, а затем предложит соответствующие обновления. Затем предложит перейти к обновлению.

Установка из PyPI

Pandas можно установить и с помощью PyPI, используя эту команду:

pip install pandas

Установка в Linux

Если вы работаете в дистрибутиве Linux и решили не использовать эти решения, то pandas можно установить как и любой другой пакет.

В Debian и Ubuntu используется команда:

sudo apt-get install python-pandas

А для OpenSuse и Fedora — эта:

zypper in python-pandas

Установка из источника

Если есть желание скомпилировать модуль pandas из исходного кода, тогда его можно найти на GitHub по ссылке https://github.com/pandas-dev/pandas:

git clone git://github.com/pydata/pandas.git
cd pandas
python setup.py install

Убедитесь, что Cython установлен. Больше об этом способе можно прочесть в документации: (http://pandas.pydata.org/pandas-docs/stable/install.html).

Репозиторий для Windows

Если вы работаете в Windows и предпочитаете управлять пакетами так, чтобы всегда была установлена последняя версия, то существует ресурс, где всегда можно загрузить модули для Windows: Christoph Gohlke’s Python Extension Packages for Windows (www.lfd.uci.edu/~gohlke/pythonlibs/). Каждый модуль поставляется в формате WHL для 32 и 64-битных систем. Для установки нужно использовать приложение pip:

pip install SomePackage-1.0.whl

Например, для установки pandas потребуется найти и загрузить следующий пакет:

pip install pandas-0.22.0-cp36-cp36m-win_amd64.whl

При выборе модуля важно выбрать нужную версию Python и архитектуру. Более того, если для NumPy пакеты не требуются, то у pandas есть зависимости. Их также необходимо установить. Порядок установки не имеет значения.

Недостаток такого подхода в том, что нужно устанавливать пакеты отдельно без менеджера, который бы помог подобрать нужные версии и зависимости между разными пакетами. Плюс же в том, что появляется возможность освоиться с модулями и получить последние версии вне зависимости от того, что выберет дистрибутив.

Проверка установки pandas

Библиотека pandas может запустить проверку после установки для верификации управляющих элементов (документация утверждает, что тест покрывает 97% всего кода).

Во-первых, нужно убедиться, что установлен модуль nose. Если он имеется, то тестирование проводится с помощью следующей команды:

nosetests pandas

Оно займет несколько минут и в конце покажет список проблем.

Модуль Nose

Этот модуль спроектирован для проверки кода Python во время этапов разработки проекта или модуля Python. Он расширяет возможности модуль unittest. Nose используется для проверки кода и упрощает процесс.

Здесь о нем можно почитать подробнее: _http://pythontesting.net/framework/nose/nose-introduction/.

Первые шаги с pandas

Лучший способ начать знакомство с pandas — открыть консоль Python и вводить команды одна за одной. Таким образом вы познакомитесь со всеми функциями и структурами данных.

Более того, данные и функции, определенные здесь, будут работать и в примерах будущих материалов. Однако в конце каждого примера вы вольны экспериментировать с ними.

Для начала откройте терминал Python и импортируйте библиотеку pandas. Стандартная практика для импорта модуля pandas следующая:

>>> import pandas as pd 
>>> import numpy as np

Теперь, каждый раз встречая pd и np вы будете ссылаться на объект или метод, связанный с этими двумя библиотеками, хотя часто будет возникать желание импортировать модуль таким образом:

>>> from pandas import *

В таком случае ссылаться на функцию, объект или метод с помощью pd уже не нужно, а это считается не очень хорошей практикой в среде разработчиков Python.

You can install the Python pandas latest version or a specific version on windows either using pip command that comes with Python binary or conda if you are using Anaconda distribution. Before using either of these commands, you need to install Python or Anaconda distribution. If you already have either one installed, you can skip the document’s first section and directly jump to installing pandas. If not let’s see how to install pandas using these two approaches. You can use either one.

Related: Install pandas Using pip or conda on Linux & Mac OS

  • pip (Python package manager) command that comes with python to install third-party packages from PyPI. Using pip you can install/uninstall/upgrade/downgrade any python library that is part of Python Package Index.
  • Conda is the package manager that comes with Anaconda distribution, It is a package manager that is both cross-platform and language agnostic.

Table of Contents

  • Install Python pandas On Windows
    • Download & Install Python
    • Install pandas using pip command
  • Install pandas Using Anaconda Distribution
    • Download & Install Anaconda
    • Install pandas using conda command

As I said above if you already have python installed and have set the path to run python and pip from the command prompt, you can skip this section and directly jump to Install pandas using-pip-command-on-windows.

1.1 Download & Install Python

Let’s see step-by-step how to install python and set environment variables.

1.1.1 Download Python

Go to https://www.python.org/downloads/ and download the latest version for windows. If you want a specific version then use Active Python Releases section or scroll down to select the specific version to download.

Python Download

This downloads the .exe file to your downloads folder.

1.1.2 Install Python to Custom Location

Now double click on the download to install it on windows. This will give you an installer screen similar to below.

From the below screen, you can select “Install Now” option if you wanted to install to the default location or select “Customize installation” to change the location where to install Python. In my case, I use the second option and installed at c:\apps\opt\python folder.

Note: Select the check box bottom of the screen that reads “Add Python 3.9 to PATH”. This adds the python location to the PATH environment variable so that you can run pip and python from the command line. In case if you do not select, don’t worry I will show you how to add python installation location to PATH post-installation.

1.1.3 Set Python Installed Location to PATH Environment

Now set the Python installed location and scripts locations (C:\apps\opt\Python\Python39;C:\apps\opt\Python\Python39\Scripts) to PATH environment variables by following the below images in order.

1.1.4 Run Python shell from Command Prompt

Now open the windows command prompt by entering cmd from windows run ( Press windows icon + R) or from the search command

This opens the command prompt. Now type python and press enter, this should give you a python prompt.

In case if you get an error like "'python' is not recognized as an internal or external command" then something wrong with your PATH environment variable from the above step. Correct it and re-open the command line and try python again. If you still get an error then try setting PATH from the command prompt by running the below command. Change paths according to your installation.


set PATH=%PATH%;C:\apps\opt\Python\Python39;C:\apps\opt\Python\Python39\Scripts;

Now type again python and confirm you are seeing the below message.

1.2 Install Pandas Using pip Command on Windows

Python that I have installed comes with pip and pip3 commands (You can find these in the python installed folder @ C:\apps\opt\Python\Python39\Scripts.

pip (Python package manager) is used to install third-party packages from PyPI. Using pip you can install/uninstall/upgrade/downgrade any python library that is part of Python Package Index.

Since the pandas package is available in PyPI, we should use this to install pandas latest version on windows.


# Install pandas using pip
pip install pandas
(or)
pip3 install pandas

This should give you output as below. If your pip is not up to date, then upgrade pip to the latest version.

To check what version of pandas installed use pip list or pip3 list commands.

If you want to install a specific version of pandas, use the below command


# Installing pandas to specific version
pip install pandas==1.3.1

In case if you wanted to upgrade pandas to the latest or specific version


# Using pip3 to upgrade pandas
pip3 install --upgrade pandas

# Alternatively you can also try
python -m pip install --upgrade pandas

This completes the installation of pandas to the latest or specific version on windows. If you have trouble installing or any steps are incorrect here, please comment. Your comment would help others !!

2. Install Pandas From Anaconda Distribution

If you already have Anaconda install then jump to Install pandas using conda command on Windows

2.1 Download & Install Anaconda distribution

Follow the below step-by-step instructions to install Anaconda on windows.

2.1.1 Download Anaconda .exe File

Go to https://anaconda.com/ and select Anaconda Individual Edition to download the latest version of Anaconda. This downloads the .exe file to the windows default downloads folder.

2.1.2 Install Anaconda on Windows

By double-clicking the .exe file starts the Anaconda installation. Follow the below screen shot’s and complete the installation

This finishes the installation of the Anaconda distribution. Now let’s see how to install pandas.

2.2 Install Pandas using conda command on Windows

2.2.1 Open Anaconda Navigator from the windows start or search box.

2.2.2 Create Anaconda Environment

This is optional but recommended to create an environment before you proceed. This gives complete segregation of different package installs for different projects you would be working on. If you already have an environment, you can use it too.

Select + Create option -> select the Python version you would like to use and enter your environment name. I am using the environment as pandas-tutorial.

2.2.3 Open Anaconda Terminal

You open the Anaconda terminal from Anaconda Navigator or open it from the windows start menu/search.

2.2.4 Install Pandas using conda

Now enter conda install pandas to install pandas in your environment. Note that along with pandas it also installs several other packages including the most used numpy.

2.2.5 Test Pandas From Command Line or Using Jupyter Notebook

now open Python terminal by entering python on the command line and then run the following command at prompt >>>.


>>> import pandas as pd
>>> pd.__version__
'1.3.2'
>>>

Writing pandas commands from the terminal is not practical in real-time, so let’s see how to run panda programs from Jupyter Notebook.

Go to Anaconda Navigator -> Environments -> your environment (mine pandas-tutorial) -> select Open With Jupyter Notebook

This opens up Jupyter Notebook in the default browser.

Now select New -> PythonX and enter the below lines and select Run.

This completes installing pandas on Anaconda and running sample pandas statements on the command line and Jupyter Notebook.

I have tried my best to cover each step, if you notice I missed any step or If you have trouble installing, please comment. Your comment would help others !!

Happy Learning !!

Frequently Asked Questions on Install Pandas on Windows Step-by-Step

How do I install Pandas on Windows?

Installing Pandas on Windows is straightforward. You can use the following steps:
Open a command prompt or Anaconda prompt.
Run the command: pip install pandas

What are the prerequisites for installing Pandas on Windows?

Before installing Pandas, ensure that you have Python installed on your Windows machine. You can download and install Python from the official Python website (https://www.python.org/).

Can I install Pandas using a virtual environment on Windows?

It’s recommended to use a virtual environment to manage dependencies. You can create a virtual environment, activate it, and then install Pandas using the provided steps.

Are there alternative methods to install Pandas on Windows?

If you are using Anaconda, you can install Pandas through the Anaconda Navigator or Anaconda prompt. Additionally, you can use other package managers like conda for installation.

What do I do if I encounter installation errors on Windows?

If you encounter any installation errors, check that your Python environment is correctly set up, and ensure that you have the necessary permissions to install packages. You may also consider using a virtual environment to isolate your project dependencies.

Can I install specific versions of Pandas on Windows?

You can install a specific version of Pandas by specifying the version number in the installation command. For example, pip install pandas==1.3.3 installs Pandas version 1.3.3.

Related Articles

  • Install Anaconda & Run pandas on Jupyter Notebook
  • Install Python Pandas on Windows, Linux & Mac OS
  • Pandas Window Functions Explained
  • Pandas API on Spark | Explained With Examples
  • How to Install Anaconda on Windows
  • Pandas Convert JSON to CSV
  • How to Check Pandas Version?
  • How to Upgrade pandas to Latest Version?
  • JupyterLab Error – JupyterLab application assets not found
  • Pandas Read Multiple CSV Files into DataFrame
  • Pandas ExcelWriter Explained with Examples
  • Upgrade Pandas Version to Latest or Specific Version

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Sign up

1. Overview

In this tutorial, we’ll learn how to install Pandas and Python on Windows. We will cover the most popular ways of installation.

The instructions described below have been tested on Windows 7 and 20.

2. Install Python on Windows 10

Python is a widely-used easy to learn, user friendly, concise and high-level programming language. It is very easy to start coding on it and has a huge community.

Python is one of the most liked and wanted languages according to: stackoverflow — Python is the most wanted language for its fifth-year

2.1. Download and Install Python on Windows

Unlike Linux, Windows doesn’t come with a pre-installed Python version.

So if we want to use the latest version of Python then manual installation is the way to go. The steps to install Python on Windows are:

  1. Go to Python Releases for Windows
  2. Select the Python version you like — I prefer to go with the Stable Releases. For example — Python 3.9.10 - Jan. 14, 2022
  3. Select the type of the installation — I prefer Download Windows installer (64-bit) — python-3.9.10-amd64.exe
  4. Download the desired version
  5. Run the Python Installer
  6. During installation
    6.1. Select Install launcher for all users — if you like to have it for all users
    6.2. Check Add Python 3.9 to PATH in order Python to be visible for other programs
  7. Press Install Now
  8. Finally you can verify the installation by checking the version — Python -V — expected output — Python 3.9.10

2.2. Create a virtual environment (optional)

Python offers a powerful package system venv which helps separate different Python packages. In simple words, you can create several virtual environments in multiple Pandas versions:

  • pandas 1.3.4
  • pandas 1.0.0

To create new virtual environment called pandas1:

  • create folder for your virtual environments ( or select existing one)
  • Run command: python -m venv pandas1
  • activate the environment by:
cd pandas1
source bin/activate

Once environment is activated you will see change in the terminal:

(pandas1) $ deactivate

The command above deactivates the environment.

To learn more please check:

  • venv — Creation of virtual environments

2.3. Install PIP (optional)

PIP is one of the most popular package managers for Python. If it’s not installed:

pip -V

will return message that the command is not recognized — then you can install it by:

py -m ensurepip --upgrade

To learn more please check:

  • PIP Installation

3. Install Pandas on Windows

3.1. Install Pandas by Pypi

Next step is to install Pandas on Windows. The most easiest way of installing Pandas is by running:

pip install pandas

You can find more information for Pandas on: pandas — pypi.org.

3.2. Install Anaconda and Pandas on Windows

If you like to use alternative installation methods you can check the official docs: Installing Anaconda on Windows.

For example Pandas is part of Anaconda — so if you install Anaconda on your system you will get Pandas:

  • download the Anaconda installer for Windows

  • Verify data integrity with SHA-256. (optional but highly RECOMMENDED step)

  • Install Anaconda by double click on the installer

  • Press Next

  • «I Agree» on — licensing terms

  • Select «Just Me» — if you are going to use it for yourself only

  • Select a destination folder

  • Click the Next button

  • Add «Anaconda to your PATH environment variable» — highly recommended

  • Continue the rest depending on your personal preferences or refer to the official installation guide

3.3. Verify Pandas installation

Finally you can test Pandas installation by running next commands:

pip freeze | grep pandas

result will be:

pandas==1.4.0

4. Conclusion

To summarize, in this article, we’ve seen examples of installing Python and Pandas on Windows in several ways. We’ve briefly explained these installation methods and how to verify the installation.

And finally, we’ve seen how to manage multiple Python/Pandas installations on Windows like systems with different package versions.

Установка¶

Проще всего установить pandas в составе Anaconda — кроссплатформенного дистрибутива для анализа данных и научных вычислений. Это рекомендуемый метод установки для большинства пользователей.

Здесь вы также найдете инструкции по установке из исходников, с помощью PyPI, ActivePython, различных дистрибутивов Linux и версию для разработки.

Поддержка версий Python¶

Официально поддерживается Python 3.8, 3.9 и 3.10.

Установка с помощью Anaconda¶

Установка pandas и остальной части стека NumPy и SciPy может быть немного сложной для неопытных пользователей.

Проще всего установить не только pandas, но и Python и самые популярные пакеты, составляющие стек SciPy (IPython , NumPy, Matplotlib и так далее) с использованием Anaconda — кроссплатформенного (Linux, macOS, Windows) дистрибутива Python для анализа данных и научных вычислений.

После запуска установщика пользователь получит доступ к pandas и остальной части стека SciPy без необходимости устанавливать что-либо еще и без необходимости ждать, пока какое-либо программное обеспечение будет скомпилировано.

Инструкции по установке Anaconda можно найти здесь.

Полный список пакетов, доступных в составе дистрибутива Anaconda, можно найти здесь.

Еще одним преимуществом установки Anaconda является то, что вам не нужны права администратора для ее установки. Anaconda может быть установлена в домашнем каталоге пользователя, что упрощает удаление Anaconda в случае необходимости (просто удалите эту папку).

Установка с помощью Miniconda¶

В предыдущем разделе было описано, как установить pandas в составе дистрибутива Anaconda. Однако этот подход означает, что вы установите более сотни пакетов и предполагает загрузку установщика, размер которого составляет несколько сотен мегабайт.

Если вы хотите иметь больший контроль над пакетами или пропускная способность интернета у вас ограничена, то установка pandas с помощью Miniconda может вам подойти лучше.

Conda — это менеджер пакетов, на котором построен дистрибутив Anaconda. Это менеджер пакетов, который является одновременно кроссплатформенным и независимым от языка (он похож на комбинацию pip и virtualenv).

Miniconda позволяет вам создать минимальную автономную установку Python, а затем использовать команды Conda для установки дополнительных пакетов (см. краткое руководство по Miniconda на русском).

Сначала вам нужно установить Conda, и загрузка и запуск Miniconda решит эту задачу. Установщик можно найти здесь.

Следующим шагом является создание новой среды conda. Виртуальная среда conda похожа на ту, которая создается virtualenv, она позволяет указать конкретную версию Python и набор библиотек. Запустите следующие команды из окна терминала:

conda create -n name_of_my_env python

Это создаст минимальную среду, в которой будет установлен только Python. Чтобы активировать эту среду, запустите:

source activate name_of_my_env

В Windows команда следующая:

Последним шагом необходимо установить pandas. Это можно сделать с помощью следующей команды:

Установить определенную версию pandas:

conda install pandas=0.20.3

Установить другие пакеты, например, IPython:

Установить полный дистрибутив Anaconda:

Если вам нужны пакеты, доступные для pip, но не для conda, установите pip, а затем используйте pip для установки этих пакетов:

conda install pip
pip install django

Установка из PyPI¶

pandas можно установить через pip из PyPI.

Примечание

У вас должен быть pip>=19.3 для установки из PyPI.

Установка с ActivePython¶

Инструкции по установке ActivePython можно найти здесь. Версии 2.7, 3.5 и 3.6 включают pandas.

Установка с помощью менеджера пакетов вашего дистрибутива Linux.¶

Команды в этой таблице установят pandas для Python 3 из вашего дистрибутива.

Дистрибутив

Статус

Ссылка на скачивание / репозиторий

Команда для установки

Debian

стабильный

Официальный репозиторий Debian

sudo apt-get install python3-pandas

Debian & Ubuntu

нестабильный (последние пакеты)

NeuroDebian

sudo apt-get install python3-pandas

Ubuntu

стабильный

Официальный репозиторий Ubuntu

sudo apt-get install python3-pandas

OpenSuse

стабильный

Репозиторий OpenSuse

zypper in python3-pandas

Fedora

стабильный

Официальный репозиторий Fedora

dnf install python3-pandas

Centos/RHEL

стабильный

Репозиторий EPEL

yum install python3-pandas

Однако пакеты в менеджерах пакетов linux часто отстают на несколько версий, поэтому, чтобы получить новейшую версию pandas, рекомендуется устанавливать ее с помощью команд pip или conda, описанных выше.

Обработка ошибок импорта¶

Если вы столкнулись с ошибкой ImportError, это обычно означает, что Python не смог найти pandas в списке доступных библиотек. Внутри Python есть список каталогов, в которых он ищет пакеты. Вы можете получить список этих каталогов с помощью команды:

Одна из возможных причин ошибки — это если Python в системе установлен более одного раза, и pandas не установлен в том Python, который вы используете на текущий момент. В Linux/Mac вы можете запустить what python на своем терминале, и он сообщит вам, какой Python вы используете. Если это что-то вроде «/usr/bin/python», вы используете Python из системы, что не рекомендуется.

Настоятельно рекомендуется использовать conda для быстрой установки и обновления пакетов и зависимостей. Вы можете найти простые инструкции по установке pandas в этом документе.

Установка из исходников¶

Полные инструкции по сборке из исходного дерева git см. в Contributing guide. Если вы хотите создать среду разработки pandas, смотрите Creating a development environment.

Запуск набора тестов¶

pandas оснащен исчерпывающим набором модульных тестов, покрывающих около 97% кодовой базы на момент написания этой статьи. Чтобы запустить его на своем компьютере и удостовериться, что все работает (и что у вас установлены все зависимости, программные и аппаратные), убедитесь, что у вас есть pytest >= 6.0 и Hypothesis >= 3.58, затем запустите:

>>> pd.test()
running: pytest --skip-slow --skip-network C:\Users\TP\Anaconda3\envs\py36\lib\site-packages\pandas
============================= test session starts =============================
platform win32 -- Python 3.6.2, pytest-3.6.0, py-1.4.34, pluggy-0.4.0
rootdir: C:\Users\TP\Documents\Python\pandasdev\pandas, inifile: setup.cfg
collected 12145 items / 3 skipped

..................................................................S......
........S................................................................
.........................................................................

==================== 12130 passed, 12 skipped in 368.339 seconds =====================

Зависимости¶

Пакет

Минимальная поддерживаемая версия

NumPy

1.18.5

python-dateutil

2.8.1

pytz

2020.1

Рекомендуемые зависимости¶

  • numexpr: для ускорения некоторых числовых операций. numexpr использует несколько ядер, а также интеллектуальное разбиение на фрагменты и кэширование для достижения значительного ускорения. Установленная версия должна быть 2.7.1 или выше.

  • bottleneck: для ускорения определенных типов оценок nan. bottleneck использует специализированные подпрограммы cython для достижения больших ускорений. Установленная версия должна быть 1.3.1 или выше.

Примечание

Настоятельно рекомендуется установить эти библиотеки, поскольку они обеспечивают повышение скорости, особенно при работе с большими наборами данных.

Дополнительные зависимости¶

pandas имеет множество необязательных зависимостей, которые используются только для определенных методов. Например, для pandas.read_hdf() требуется пакет pytables, а для DataFrame.to_markdown() – пакет tabulate. Если необязательная зависимость не установлена, pandas выведет ImportError при вызове метода, требующего этой зависимости.

Визуализация¶

Зависимость

Минимальная версия

Примечания

matplotlib

3.3.2

Библиотека графиков

Jinja2

2.11

Условное форматирование с DataFrame.style

tabulate

0.8.7

Печать в формате, дружественном к Markdown (см. tabulate)

Вычисления¶

Зависимость

Минимальная версия

Примечания

SciPy

1.14.1

Дополнительные статистические функции

numba

0.50.1

Альтернативный механизм выполнения операций прокатки (см. Enhancing performance)

xarray

0.15.1

pandas-подобный API для N-мерных данных

Файлы Excel¶

Зависимость

Минимальная версия

Примечания

XLRD

2.0.1

Чтение Excel

xlwt

1.3.0

Запись Excel

xlsxwriter

1.2.2

Запись Excel

openpyxl

3.0.3

Чтение и запись файлов xlsx

pyxlsb

1.0.6

Чтение файлов xlsb

HTML¶

Зависимость

Минимальная версия

Примечания

BeautifulSoup4

4.8.2

Парсер HTML для read_html

html5lib

1.1

Парсер HTML для read_html

lxml

4.5.0

Парсер HTML для read_html

Для использования функции верхнего уровня read_html() необходима одна из следующих комбинаций библиотек:

  • BeautifulSoup4 и html5lib

  • BeautifulSoup4 и lxml

  • BeautifulSoup4 и html5lib и lxml

  • Только lxml, хотя в HTML Table Parsing Gotchas объясняется, почему вам, вероятно, не следует использовать этот подход.

Предупреждение

  • Если вы устанавливаете BeautifulSoup4, вы должны установить либо lxml, либо html5lib, либо оба. read_html() не работает, если установлен только BeautifulSoup4 (см. подробнее о парсерах в документации BeautifulSoup на русском).

  • Настоятельно рекомендуется прочитать HTML Table Parsing Gotchas. Там объясняются проблемы, связанные с установкой и использованием трех вышеуказанных библиотек.

XML¶

Зависимость

Минимальная версия

Примечания

lxml

4.5.0

Анализатор XML для read_xml и построитель дерева для to_xml

Базы данных SQL¶

Зависимость

Минимальная версия

Примечания

SQLAlchemy

1.4.0

Поддержка SQL для баз данных, отличных от sqlite

psycopg2

2.8.4

Движок PostgreSQL для sqlalchemy

pymysql

0.10.1

Движок MySQL для sqlalchemy

Другие источники данных¶

Зависимость

Минимальная версия

Примечания

PyTables

3.6.1

Чтение и запись на основе HDF5

blosc

1.20.1

Сжатие для HDF5

zlib

Сжатие для HDF5

fastparquet

0.4.0

Чтение и запись parquet

pyarrow

1.0.1

Чтение и запись parquet, ORC и feather

pyreadstat

1.1.0

Чтение файлов SPSS (.sav)

Предупреждение

  • Если вы хотите использовать read_orc(), настоятельно рекомендуется установить pyarrow с помощью conda. Ниже приводится краткое описание среды, в которой может работать read_orc().

    Система

    Conda

    PyPI

    Linux

    Успешно

    Ошибка (pyarrow == 3.0 Успешно)

    macOS

    Успешно

    Не удалось

    Windows

    Не удалось

    Не удалось

Доступ к данным в облаке¶

Зависимость

Минимальная версия

Примечания

fsspec

0.7.4

Обработка файлов помимо простых локальных и HTTP

gcsfs

0.6.0

Доступ к облачному хранилищу Google

pandas-gbq

0.14.0

Доступ к Google Big Query

s3fs

0.4.0

Доступ к Amazon S3

Буфер обмена¶

Зависимость

Минимальная версия

Примечания

PyQt4/PyQt5

Ввод и вывод буфера обмена

qtpy

Ввод и вывод буфера обмена

xclip

Ввод и вывод буфера обмена в Linux

xsel

Ввод и вывод буфера обмена в Linux

Сжатие¶

Зависимость

Минимальная версия

Примечания

Zstandard

Сжатие Zstandard

Понравилась статья? Поделить с друзьями:
0 0 голоса
Рейтинг статьи
Подписаться
Уведомить о
guest

0 комментариев
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии
  • Windows no audio device detected
  • Windows 10 build 15002
  • Какие кодеки нужны для windows xp
  • Как удалить обновление безопасности для microsoft windows
  • Установить service pack 1 для windows 7 32 bit