В папке hw_1 лежит первое дз. Чтобы запустить, нужно:
- из директории hw_1 в терминале запустить python main.py
- программа попросит вас указать путь до папки friends-data на вашем компьютере (напр. /Users/kseniapetuhova/Desktop/friends-data)
В папке hw_2 лежит второе дз. Чтобы запустить, нужно:
- из директории hw_2 в терминале запустить python main.py
- программа попросит вас указать путь до папки friends-data на вашем компьютере (напр. /Users/kseniapetuhova/Desktop/friends-data)
В папке hw_3 лежит третье дз. Чтобы запустить, нужно:
- из директории hw_3 в терминале запустить python main.py
- программа попросит вас указать путь до папки, где лежит корпус на вашем компьютере (напр. /Users/kseniapetuhova/Desktop/hw3)
В папке hw_4 лежит четвертое дз. Чтобы запустить, нужно:
- Либо положить модель фасттекста в ту же папку (hw_4), либо предварительно в терминале запустить:
!wget "https://rusvectores.org/static/models/rusvectores4/fasttext/araneum_none_fasttextcbow_300_5_2018.tgz"
tar zxvf araneum_none_fasttextcbow_300_5_2018.tgz
- из директории hw_4 в терминале запустить python task_1.py, а потом python task_2.py
- в обоих случаях программа попросит вас указать путь до папки, где лежит корпус на вашем компьютере (напр. /Users/kseniapetuhova/Desktop/hw_4)
- в первом задании мы сохраняем индексированные корпуса в файлы, чтобы сэкономить время во время выполнения второго задания
В папке project лежит финальный проект. Чтобы запустить, нужно:
- Либо положить модель фасттекста в ту же папку (hw_4), либо предварительно в терминале запустить:
!wget "https://rusvectores.org/static/models/rusvectores4/fasttext/araneum_none_fasttextcbow_300_5_2018.tgz"
tar zxvf araneum_none_fasttextcbow_300_5_2018.tgz
- положить в папку с проектом корпус ответов
- из директории проекта запустить в терминале следующие команды:
pipenv shell
streamlit run main.py
Ссылка на поисковик: http://172.20.10.2:8501