Программирование гуманитарная наука

Язык программирования Python В настоящее время этот язык широко используется во многих научных областях. И он легко доступен ученым-гуманитариям. Python-отличный выбор для работы с текстовыми данными (как лингвистическими, так и литературными). Что так характерно для гуманитарных наук. В этой книге вы подробно познакомитесь с языком и научитесь программировать основные алгоритмические процедуры. Книга не предполагает предварительного опыта в программировании. Хотя мы надеемся предоставить некоторые интересные идеи и навыки для более продвинутых программистов. Книга состоит из 10 глав. Глава 5 и глава 6 все еще находятся в состоянии проекта и не готовы к использованию.

  • Глава 1 начинается с самых основ, где мы постараемся разжечь ваш аппетит. Вам будет предложено сделать много коротких тестов, чтобы проверить. Действительно ли вы понимаете материал.
  • Глава 2 познакомит вас с задачей обработки текста. Вы узнаете, как читать файлы с вашего компьютера. Как очистить их и вычислить частотное распределение по словам.
  • Глава 3 посвящена предварительной обработке текста. Вы узнаете некоторые из элементарных инструментов для анализа ваших данных.
  • Глава 4-это более теоретическая глава. Которая объясняет вам некоторые основные принципы программирования. Общие практики и где найти документацию.

  • В главе 5 все становится сложнее. Во-первых, вы напишете программу для вычисления читаемости текстов. Далее вы реализуете основной алгоритм, стоящий за атрибуцией авторства!
  • В главе 6 мы познакомим вас с концепцией объектно-ориентированного программирования. Вы реализуете сетевую структуру. С помощью которой можно анализировать отношения между людьми в Twitter.
  • Начиная с главы 7, мы начнем работать над более реальными приложениями.

    В главе 7 мы будем работать над системами архивирования и поиска по наборам текстов. Мы познакомим вас с областью информационного поиска и построим простую информационно-поисковую систему. Эта глава углубляет ваши знания об объектно-ориентированном программировании.

  • В главе 8 мы создадим полноценное веб-приложение для поиска в вашей собственной библиотеке PDF-файлов. Это будет наше первое реальное приложение, готовое к использованию конечными пользователями. В этой главе вы познакомитесь со многими модулями, доступными как в стандартной библиотеке. Так и в сторонних модулях.

  • Глава 9 познакомит вас с некоторыми из наиболее продвинутых методов. Используемых в автоматической классификации. Мы реализуем наивный байесовский классификатор. Покажем вам ряд оценочных метрик и стратегий и кратко рассмотрим вопрос оптимизации параметров.
  • Глава 10 посвящена иерархической кластеризации, одному из важных методов обучения без контроля. Мы объясняем основные методы построения иерархической кластеризации и создаем простую реализацию в Python.

Этот документ описывает процедуру установки для всего программного обеспечения. Необходимого для класса Python.

Если вы застряли где-либо в процессе установки, пожалуйста. Не стесняйтесь обращаться к Folgert Karsdorp.

Текстовый редактор

Мы советуем вам установить хороший текстовый редактор, например Sublime text 2/3. Тем не менее, вы абсолютно свободны использовать свой собственный любимый редактор. Для возвышенного текста 2/3 перейдите на http://www.sublimetext.com/ загрузите версию для вашей операционной системы и установите ее.

В ходе мы будем использовать программное обеспечение. Которое лучше всего работает с Google Chrome. Firefox 6 (или выше) и Safari также будут работать. Internet Explorer не поддерживается.

Мы будем использовать Python 3.4 для нашего курса. Более низкие версии более или менее поддерживаются, но не рекомендуются.

Установка

Все платформы

Мы настоятельно рекомендуем вам установить дистрибутив Anaconda Python. Этот дистрибутив содержит все необходимые модули и пакеты, необходимые для данного курса. Он доступен для всех платформ и обеспечивает простую процедуру установки/ Вы можете скачать его по адресу: http://continuum.io/downloads. Более подробные инструкции по установке можно найти здесь: http://docs.continuum.io/anaconda/install.html

Установка Anaconda по умолчанию-Python 2.7. Однако в этом курсе мы будем использовать Python 3. Чтобы установить все необходимые пакеты для Python 3.4, введите

conda create -n py34 python=3.4 anaconda

с последующим

источник активация py34

в командной строке. Если вы работаете на компьютере с Windows, используйте вместо этого следующую команду:

активировать py34

(Если это не сработает. Посмотрите здесь: http://continuum.io/blog/anaconda-python-3). После этого вы можете начать курс. Дважды щелкнув файл start-windows.bat (если вы работаете на Windows) или start-unix.sh если вы работаете с Linux или start-osx.command. Если вы работаете с Mac OS X.

Windows

Загрузите и установите дистрибутив Anaconda Python (см. Выше).

Дважды щелкните файл start-windows.bat.

Если все идет правильно. Это должно открыть ваш браузер (предпочтительно Google Chrome или Firefox) на странице http://127.0.0.1:8888/ (или что-то подобное). Которое говорит IP\[y\]: Notebook. Если по какой-то причине ноутбук открыт Internet Explorer. Скопируйте URL-адрес и вставьте его в Google Chrome или Firefox.

OS X

Делайте эти шаги только в том случае, если вы знаете, что делаете. В противном случае просто скачайте и установите дистрибутив Anaconda Python (см. Выше). После этого дважды щелкните файл start-osx.command.

Сначала вам нужно будет установить Xcode из App Store. Теперь нажмите на кнопку установить рядом с инструментами командной строки.

Откройте spotlight и введите terminalкоманду. Чтобы открыть приложение терминала. (Вы также можете перейти в папку applications. А затем в utilities. Где вы найдете terminal.app)

Компакт диск в папку в которую вы загрузили или сохранили файл mac-installer.sh (вероятно. В ~/загрузках) с помощью

cd /folder/of/mac-installer.sh

Запустите программу установки с помощью следующей команды. Установщик загрузит некоторые пакеты и запросит ваш пароль для их установки.

... mac-installer.sh

Чтобы проверить правильность установки, перезапустите приложение terminal.app. Затем введите

ноутбук ipython3 --matplotlib=встроенный

Если все прошло хорошо. То это должно открыть ваш браузер (лучше всего с Google Chrome или Firefox) на этой странице http://127.0.0.1:8888/ который говорит IP[y]: Ноутбук.

Linux (Ubuntu/Debian)

Делайте эти шаги только в том случае, если вы знаете, что делаете. В противном случае просто скачайте и установите дистрибутив Anaconda Python

Сначала откройте терминал, затем введите

sudo apt-get install python3 ipython3 ipython3-notebook numpy scipy matplotlib flask whoosh seaborn

Если вы запускаете другой дистрибутив Linux. Подобные пакеты должны быть доступны. Наконец выполните файл start-unix.sh.

Статические записные книжки

Это запасной метод.

Глава 1 — Начало работы

Глава 2 — Первые шаги в обработке текста

Глава 3 — Анализ текста

Глава 4 . Принципы программирования

Глава 5 . Построение приложений НЛП

Глава 6 — Объектно-Ориентированное программирование

Глава 7 — Архивирование и поиск

Глава 8 — Практическая: Поиск вашей собственной библиотеки PDF-файлов

Глава 9 — Обучение на примерах

Глава 10 — Обучение без присмотра