Görüntüleme (gezinme ile): 6 -- Görüntüleme (arama ile): 6 -- IP: 3.144.212.145 -- Ziyaretçi Sayısı:

Özgün Başlık
Automatic Discovery of Similar Words by Substitute Vectors

Yazarlar
İnci Düzenli, M. Fatih Amasyalı

Dergi Adı
Sigma : Mühendislik ve Fen Bilimleri Dergisi

Cilt
2016, Cilt 34, Sayı 1, ss. 125-133

Anahtar Kelimeler
Automatic information extraction ; discovery of similar words ; synonyms ; near-synonyms ; substitute vectors ; natural language processing ; artificial intelligence

Özet
Patterns between words are generally used for automatic information extraction. However, the patterns can only find related words close to each other. In this study, a method based on substitute vectors can overcome of this difficulty. Firstly, the word sets having the same substitute vector are constructed. Then, similar word sets are obtained according to the number of co-occurring sets. In this sets, semantically relatedness ratio is above 70%. The proposed method is unsupervised. Because, it does not require any seed words manually labeled.

Başlık (Yabancı Dil)
Eş-Bağlamlılık Tabanlı Benzer Anlamlı Kelime Bulma

Anahtar Kelimeler (Yabancı Dil)
Otomatik bilgi çıkarımı ; benzer kelimelerin otomatik bulunması ; eşanlamlı kelimeler ; yakın anlamlı kelimeler ; bağlam vektörleri ; doğal dil işleme ; yapay zeka

Özet (Yabancı Dil)
Otomatik bilgi çıkarımında genelde kelimeler arası şablonlar kullanılır. Ancak, şablonlar birbirine yakın konumlardaki kavramlar arasındaki ilişkileri bulabilir. Bu çalışmada aralarındaki mesafeden bağımsız olarak ilişkili iki kavramı bulabilen eş-bağlamlılık tabanlı bir yaklaşım önerilmiştir. Yaklaşımda önce etrafında aynı kelimeler bulunan kelime kümeleri bulunmuş, ardından kelime ikililerinin bu kümelerde kaç kez beraber geçtiklerine göre de benzer anlamlı kelime kümeleri elde edilmiştir. Sonuçta %70’in üzerinde anlamsal birlik doğruluğuna sahip benzer anlamlı kelime kümelerini bulunmuştur. Yöntem eğiticisiz olup, şablonlar yönteminin gerektirdiği etiketli kavram ikililerine ihtiyaç duymamaktadır.