Turkish NLP Guide |
---|
Bu repo 📚 Türkçe Doğal Dil İşleme (NLP) alanında kullanabileceğiniz değerli kaynaklara erişebilmenizi sağlıyor. Burada, Türkçe Doğal Dil İşleme alanıyla ilgili güncel ve değerli bilgilere kolayca ulaşabilirsiniz.
Türkçe'nin dil teknolojileri alanındaki zengin potansiyelini keşfetmek için bu repoyu kullanabilirsiniz. 💡 Ayrıca, Teknofest Türkiye birincilerinin çalışmalarına da yer verdim. Böylelikle benzersiz ve heyecan verici projeleri keşfetme imkanı elde edebilirsiniz.
Son olarak, unutmayın ki bu repo herkesin faydalanabileceği bir kaynaktır ve katkılarınızla Türkçe Doğal Dil İşleme alanına ve literatürüne önemli katkılarda bulunabilirsiniz. Sizin contribution (katkı) sağlamanız diğer insanları etkileyebilir ve ülkemize büyük faydalar sağlayabilir. Bu repo, katkıda bulunabileceğiniz bir ortamdır. Kendi kaynaklarınızı eklemek için pull request açarak contribution
kısmında görünme fırsatını yakalayabilirsiniz. Türkçe Doğal Dil İşleme alanına yapacağınız katkılar ülkemize değer katabilir.
Haydi, Türkçe'nin dil işleme yeteneklerini birlikte keşfedelim ve bu alandaki geleceği birlikte şekillendirelim! 🚀🇹🇷
⭐️ Lütfen bu repoya star vermeyi unutmayalım! ⭐️
Tarih | Derece | Takım Adı | Github Link |
---|---|---|---|
Türkçe Doğal Dil İşleme Yarışması 2020 | 1. | FİXY | GitHub |
2. | Global Maksimum | GitHub | |
3. | CLUTCH | Bulunamadı | |
Türkçe Doğal Dil İşleme Yarışması 2021 | 1. | TDD | GitHub |
2. | TURQUEST | GitHub | |
3. | BİLİRKİŞİ | GitHub | |
Türkçe Doğal Dil İşleme Yarışması 2022 Kamuda Mevzuat Arama Motoru Geliştirme Kategorisi | 1. | L2 Regülasyon | GitHub |
2. | trtmlteam22 | GitHub | |
3. | IFL GARAJI 10100 | GitHub | |
Türkçe Doğal Dil İşleme Yarışması 2022 Serbest Kategori | 1. | Nane&Limon | GitHub |
2. | TEXT-GEN | Bulunamadı | |
3. | nlpTurk | GitHub | |
Türkçe Doğal Dil İşleme Yarışması 2023 | 1. | Nane&Limon | GitHub |
2. | Overfit-GM (huggingface) | Hugging Face | |
3. | BRAIN-TR (LinkedIn) |
Kategori | Kütüphane/Model/Araç | Açıklama | Kaynak |
---|---|---|---|
Model | BERTurk | BERTurk, Türkçe için BERT/DistilBERT, ELECTRA ve ConvBERT modelleri içerir. | GitHub |
Model | Loodos/Turkish Language Models | Loodos/Turkish Language Models reposu, Transformer tabanlı Türkçe dil modelleri ve ilgili araçları içermektedir. | GitHub |
Model | ELMO For ManyLangs | ELMO For ManyLangs, birçok dil için önceden eğitilmiş ELMo temsillerini içerir. | GitHub |
Model | Fasttext - Word Vector | Fasttext - Word Vector, Common Crawl ve Wikipedia üzerinde fastText kullanılarak eğitilmiş 157 dil için önceden eğitilmiş kelime vektörlerini içerir. | Resmi Web Sitesi |
Model | Turkish GPT (gpt-2.8.1-turkish-cased) | Turkish GPT (gpt-2.8.1-turkish-cased) | Hugging Face |
Model | Turkish-Text-Sentiment-Analysis | Turkish-Text-Sentiment-Analysis, Türkçe metinlerin duygu analizini yapabilen bir modeldir. | HuggingFace |
Model | HuggingFace - Diğer Türkçe Modeller | HuggingFace Portalı'nda yayınlanan diğer Türkçe modelleri içerir. | HuggingFace |
Kütüphane | ITU Turkish NLP | Istanbul Technical University, Natural Language Processing Group tarafından sağlanan araçlar ve hizmetler. | ITU Turkish NLP |
Kütüphane | spaCy Turkish models | spaCy tarafından sağlanan Türkçe modeller. | spaCy Turkish models |
Kütüphane | VNLP | VNLP, Türkçe dil için state-of-the-art ve hafif NLP araçları sağlar. | GitHub |
Kütüphane | Zemberek-NLP | Türkçe için doğal dil işleme araçları sağlayan Zemberek-NLP. | GitHub |
Kütüphane | Zemberek-Python | Zemberek'in Python implementasyonu. | GitHub |
Word Embeddings | Floret Embeddings | Turkish Floret Embeddings, large and medium sized. | HuggingFace |
Word Embeddings | VNLP Word Embeddings | Word2Vec Turkish word embeddings. | VNLP |
Word Embeddings | TurkishGloVe | Turkish GloVe word embeddings. | GitHub |
Araç | brolin59/trnlp | Türkçe NLP için bazı araçlar. | GitHub |
Araç | akoksal/Turkce-Duygu-Takibi | Twitter Türkiye için duygu analizi aracı. | GitHub |
Araç | MeteHanC/turkishnlp | Basit ama iyi Türkçe NLP araçları. | GitHub |
Araç | deeplearningturkiye/kelime_kok_ayirici | Derin Öğrenme ile Türkçe kök bulma aracı. | GitHub |
Araç | emres/turkish-deasciifier | Türkçe karakter düzeltici. | GitHub |
Araç | google-research/turkish-morphology | Türkçe için iki seviyeli morfolojik analiz aracı. | GitHub |
Araç | GlobalMaksimum/sadedegel | Türkçe haber özetleyici. | GitHub |
Araç | Fixy-TR/fixy | Duygu analizi ve Türkçe yazım denetimi için bazı kurallara göre düzeltme yapabilen bir kütüphane. | GitHub |
Araç | ardauzunoglu/rte-speech-generator | Türkiye Cumhurbaşkanı için yeni söylemler oluşturmak için Doğal Dil İşleme. | GitHub |
Araç | Zemberek-Server | Zemberek Türkçe NLP Java Kütüphanesi üzerinde çalışan REST Docker Sunucusu. | GitHub |
Araç | Mukayese | Türkçe NLP araçlarını ve görevlerini karşılaştırmak için bir ölçekleme platformu. | GitHub |
Araç | Turkish Stemmer | Türkçe dil için kök bulma algoritması. | GitHub |
Araç | sinKAF | Türkçe cümlelerde ahlaki olmayan ifadelerin tespiti için bir makine öğrenimi kütüphanesi. | GitHub |
Araç | TDD - Tools | Turkish Data Depository (TDD) projesi tarafından sağlanan çevrimiçi araçlar. | TDD - Tools |
Araç | Turkish-Summarizer - SadedeGel | Turkish-Summarizer - SadedeGel, Türkçe metinleri özetlemek için kullanılabilir bir araçtır. | GitHub |
Araç | TrTokenizer | Türkçe dil için cümle ve kelime tokenizasyonu sağlayan bir araç. | GitHub |
Araç | Starlang NLP Araçları | Starlang tarafından sağlanan Türkçe NLP araçları. | Morphological Analysis, Spell Checker, Dependency Parser, Deasciifier, NER |
Araç | snnclsr/NER | Türkçe Dil için Adlandırılmış Varlık Tanıma sistemi. | GitHub |
Kategori | Açıklama | Link |
---|---|---|
Articles | Two-level Description of Turkish Morphology | Link |
Articles | Doğal Dil İşleme İle Türkçe Yazım Hatalarının Denetlenmesi | Link |
Articles | Türkçe ve Doğal Dil İşleme | Link |
Articles | Doğal Dil İşleme | Link |
Articles | TÜRKÇE İÇİN DERİN ÖĞRENME TABANLI DOĞAL DİL İŞLEME MODELİ GELİŞTİRİLMESİ | Link |
Articles | TÜRKÇE OTOMATİK HECELEME SİSTEMİ VE HECE İSTATİSTİKLERİ | Link |
Articles | Türkçe Haber Metinlerinin Konvolüsyonel Sinir Ağları ve Word2Vec Kullanılarak Sınıflandırılması | Link |
Articles | LSTM Ağları ile Türkçe Kök Bulma | Link |
Articles | Türkçe Tweetler Üzerinde Otomatik Soru Tespiti | Link |
Articles | Classification of News according to Age Groups Using NLP | Link |
Articles | Açık Kaynak Doğal Dil İşleme Kütüphaneleri | Link |
Articles | Neden yasaklandı? Depremle ilgili Ekşi Sözlük yorumlarına NLP gözüyle bakış | Link |
Articles | A collection of brand new datasets for Turkish NLP | Link |
Videos | Uygulamalı Türkçe doğal dil işleme evreleri | Link |
Videos | Türkçe Doğal Dil İşleme - Kemal Oflazer | Link |
Videos | BOUN - Yapay Öğrenmeye Giriş - İsmail Arı Yaz Okulu 2018 | Link |
Videos | BOUN - Doğal Dil İşleme - İsmail Arı Yaz Okulu 2018 | Link |
Videos | BOUN - Konuşma / İşleme - İsmail Arı Yaz Okulu 2018 | Link |
Videos | BOUN - Yapay Öğrenme Yaz Okulu 2020 | Link |
Videos | Açık Seminer - NLP 101 Doğal Dil İşlemeye Giriş ve Uygulamalı Metin Madenciliği | Link |
Videos | Starlang Yazılım Channel | Link |
Videos | NLP with Duygu | Link |
Kategori | İsim | Açıklama | Kaynak |
---|---|---|---|
NLP | TDD - Türkçe Dil Deposu (Türkçe Dil Deposu) | Türkiye Açık Kaynak Platformu'nun ana projelerinden biri olan Türkçe Doğal Dil İşleme Projesi, Türk metinlerinin işlenmesi için gereken veri setlerini hazırlamayı amaçlamaktadır. | TDD |
NLP | İTÜ NLP Grubu - Veri Setleri | İstanbul Teknik Üniversitesi, Doğal Dil İşleme Grubu'nun veri setleri. | ITU NLP Grubu |
NLP | Boğaziçi Üniversitesi TABI - NLI-TR | Türkçe Doğal Dil İşlemede, Amazon Translate kullanılarak temel NLI veri kümeleri (SNLI ve MultiNLI) çevrilerek elde edilen büyük ölçekli iki veri kümesi. | Boun-TABI/NLI-TR |
NLP | Türkçe NLP Suite Veri Setleri | Türkçe NLP Suite Projesi, Türkçe NLP için çeşitli dilbilimsel kaynaklar sunmaktadır. Repo şu anda çeşitli NER veri setleri, tıbbi NLP veri setleri ve film incelemeleri, ürün incelemeleri ve daha fazlasını içeren duygu analizi veri setlerini içermektedir. | Turkish NLP Suite Veri Setleri |
NLP | Bilkent Turkish Writings Dataset | - | Bilkent Turkish Writings Dataset |
NLP | YTÜ Kemik Doğal Dil İşleme Grubu | - | YTÜ Kemik Doğal Dil İşleme Grubu |
Resmi Kurumlar | Resmi İstatistik Portalı | - | Resmi İstatistik Portalı |
Resmi Kurumlar | Türkiye İstatistik Kurumu (TUİK) | - | Türkiye İstatistik Kurumu (TUİK) |
Resmi Kurumlar | Türkiye Cumhuriyeti Merkez Bankası | - | Türkiye Cumhuriyeti Merkez Bankası |
Resmi Kurumlar | ULAKBİM Veri Portalı | - | ULAKBİM Veri Portalı |
Resmi Kurumlar | Yüksek Seçim Kurulu Açık Veri Portalı | - | Yüksek Seçim Kurulu Açık Veri Portalı |
Resmi Kurumlar | Sağlık Bakanlığı Açık Veri Portalı (Pilot Çalışma) | - | Sağlık Bakanlığı Açık Veri Portalı (Pilot Çalışma) |
Resmi Kurumlar | Türkiye Ulusal Coğrafi Bilgi Portalı | - | Türkiye Ulusal Coğrafi Bilgi Portalı |
Resmi Kurumlar | Türkiye Ulusal Coğrafi Açık Veri Portalı | - | Türkiye Ulusal Coğrafi Açık Veri Portalı |
Belediyeler | İstanbul Büyükşehir Belediyesi Açık Veri Portalı | - | İstanbul Büyükşehir Belediyesi Açık Veri Portalı |
Belediyeler | Küçükçekmece Belediyesi Açık Veri Platformu | - | Küçükçekmece Belediyesi Açık Veri Platformu |
Belediyeler | Beyoğlu Açık Veri Setleri | - | Beyoğlu Açık Veri Setleri |
Belediyeler | Tuzla Belediyesi Açık Veri Portalı | - | Tuzla Belediyesi Açık Veri Portalı |
Belediyeler | İzmir Büyükşehir Belediyesi Açık Veri Portalı | - | İzmir Büyükşehir Belediyesi Açık Veri Portalı |
Belediyeler | Konya Açık Veri Portalı | - | Konya Açık Veri Portalı |
Belediyeler | Balıkesir Büyükşehir Belediyesi Açık Veri Platformu | - | Balıkesir Büyükşehir Belediyesi Açık Veri Platformu |
Belediyeler | Bursa Açık Veri Platformu | - | Bursa Açık Veri Platformu |
Belediyeler | Kocaeli Büyükşehir Belediyesi Açık Veri Paylaşımı | - | Kocaeli Büyükşehir Belediyesi Açık Veri Paylaşımı |
Belediyeler | Marmara Belediyeler Birliği Açık Veri Portalı | - | Marmara Belediyeler Birliği Açık Veri Portalı |
Belediyeler | Ankara Büyükşehir Belediyesi Açık Veri Portalı | - | Ankara Büyükşehir Belediyesi Açık Veri Portalı |
Belediyeler | Gaziantep Büyükşehir Belediyesi Açık Veri Portalı | - | Gaziantep Büyükşehir Belediyesi Açık Veri Portalı |
Belediyeler | Ordu Büyükşehir Belediyesi Coğrafi Açık Veri Portalı | - | Ordu Büyükşehir Belediyesi Coğrafi Açık Veri Portalı |
Üniversiteler | Fırat Üniversitesi Büyük Veri ve Yapay Zeka Laboratuvarı Veri Setleri | - | Fırat Üniversitesi Büyük Veri ve Yapay Zeka Laboratuvarı Veri Setleri |
COVID | T.C. Sağlık Bakanlığı COVID-19 Bilgilendirme Platformu | - | T.C. Sağlık Bakanlığı COVID-19 Bilgilendirme Platformu |
COVID | Türkiye COVID-19 Pandemi İzlem Ekranı (TURCOVID19) | - | Türkiye COVID-19 Pandemi İzlem Ekranı (TURCOVID19) |
Finans | Borsa İstanbul Data Store | - | Borsa İstanbul Data Store |
Finans | Dünya Bankası - Türkiye | - | Dünya Bankası - Türkiye |
API | Merkez Bankası Python API | - | Merkez Bankası Python API |
API | Merkez Bankası R API | - | Merkez Bankası R API |
Diğer | Amazon MASSIVE | MASSIVE, 51 dilde 1 milyon cümlelik bir paralel veri kümesidir ve NLU görevleri için niyet tahmini ve yuva etiketleme için açıklamalar içermektedir. | Amazon MASSIVE |
Diğer | OPUS: en-tr | OPUS, web'den çevrilmiş metinlerin büyüyen bir koleksiyonudur. OPUS projesinde, ücretsiz çevrimiçi veriyi dönüştürmeye, dilbilimsel etiket eklemeye ve topluluğa genel olarak erişilebilir bir paralel derlem sağlamaya çalışıyoruz. | OPUS: en-tr |
Diğer | CC-100 | Web Tarama Verisinden Tek Dilli Veri Kümesi. Bu derleme, 100'den fazla dil için tek dilli veri içermektedir. | CC-100 |
Diğer | OSCAR | OSCAR, Ungoliant mimarisi kullanılarak Common Crawl korpusunun dil sınıflandırması ve filtrelemesi ile elde edilen devasa çok dilli bir derlemedir. | OSCAR |
Diğer | Universal Dependencies | Universal Dependencies, dünya dillerinin TreeBank oluşturmak için uluslararası bir işbirliği projesidir. | Universal Dependencies |
Diğer | UD Turkish Kenet | Türkçe-Kenet UD TreeBank, 18.700 el ile işaretlenmiş cümle ve 178.700 sözcükten oluşmaktadır. Korpusu, TDK'dan sözlük örneklerini içermektedir. | UD Turkish Kenet |
Diğer | UD Turkish BOUN | BOUN TreeBank, TABILAB tarafından oluşturulmuş ve TÜBİTAK tarafından desteklenmektedir. Bu derleme, 9.761 cümle ve 121.214 sözcük içermektedir. | UD Turkish BOUN |
Diğer | hermitdave/Frequency Word List | - | Frequency Word List |
Diğer | Bilkent Turkish Writings Dataset | - | Bilkent Turkish Writings Dataset |
Diğer | 170k Turkish Sentences from Wikipedia | - | 170k Turkish Sentences from Wikipedia |
Diğer | Wiktionary:Frequency Lists - Turkish | - | Wiktionary:Frequency Lists - Turkish |
Diğer | ooguz/Bad Word Blacklist for Turkish | - | ooguz/Bad Word Blacklist for Turkish |
Diğer | ahmetax/Turkish Stop Words List | - | ahmetax/Turkish Stop Words List |
Diğer | NLTK - Stop Words | - | NLTK - Stop Words |
Diğer | Tatoeba: Çok Dilli Cümleler | - | Tatoeba: Çok Dilli Cümleler |
Diğer | 466k İngilizce Kelime | - | 466k İngilizce Kelime |