1 of 10

სასამართლო გადაწყვეტილებები ძიება

ჯინა კიოდო

მარიამ მგელაძე

ესმა ჩხიკვაძე

2 of 10

გეგმა:

  • პრობლემა
  • კორპუსის შექმნა
  • არსებული ფუძეების შეფასება
    • ქართული
    • საბოლოო მიზანი
  • ახალი გამოყოფილი ფუძე
  • გამოყოფილი ფუძის გამოყენება

3 of 10

გამოყოფილი ფუძე

შემდეგი მაგალითები შეიცავს ფუძეს წავ

  • ვსწავლობ (მე)
  • სწავლობ (შენ)
  • სწავლობს (ის)
  • ვსწავლობთ (ჩვენ)
  • ისინი სწავლობენ
  • მასწავლებელი
  • კითხვის სწავლა
  • წავლული

4 of 10

Words

მნიშვნელობა

სიტყვები

5 of 10

გამოყოფილი ფუძე

ქართული ენისთვის

6 of 10

არსებული გავრცელებული ფუძეები

  • Snowball Stemmer (სნობალი)
    • თურქული
    • სომხური
    • უნგრული და სხვა
  • Lucene Analyzer (ლუსინი)
    • თურქული
    • სომხური
  • NLTK Stemmer (ენელთიკაი)
    • უნგრული

  • Hunspell (ჰუნსპელი)
    • თურქული
    • უნგრული და სხვა
  • Aspell (ესპელი)
    • 74 ენაზე მეტი

7 of 10

კორპუსის შექმნა

  • სასამართლო გადაწყვეტილებების წყაროების აღმოჩენა
  • სარკისებური წყაროები
  • ტექსტის ამოღება .html-დან, .doc-დან, .docx-დან, .pdf-დან
  • ტექსტის გადატანა სარევიზიო კონტროლის საცავში (Git)

8 of 10

ახალი გამოყოფილი ფუძე

ზომა:

  • სიტყვები: 9999
  • წესები: 999

შეფასება:

  • საბოლოო მომხმარებლები:
    • LibreOffice (საადვოკატო ბიურო)
    • Chrome Extension (ძირითადი დანიშნულების ინტერნეტში აკრეფის ჩანართი)
  • უკვე არსებულ პროგრამულ უზრუნველყოფაში შერწყმა:
    • Joomla (PHP ვებ გვერდები)
    • Wordpress საძიებო ჩანართი
    • ElasticSearch (Enterprise Search Engine)

9 of 10

გამოყოფილი ფუძის გამოყენება

ჩამოტვირთულები:

  • Lucene Analyzer (Java)
  • Snowball (PHP, Python, Perl)
  • Aspell (PHP)
  • Hunspell (OpenOffice, LibreOffice და ა.შ.)

სასწავლო აპლიკაციები:

https://github.com/batumi/Gadatsqvetilebebi

Corpora:

https://github.com/batumi/SakartvelosUzenaesiSasamartloSarke

https://github.com/batumi/SamartlosSakonstitutsioSasamartdoSarke

10 of 10

წყაროები