Etkisiz kelimeler

Bilgisayar dilinde, etkisiz kelimeler, doğal data dilinin (text) işlenmeden önce veya sonra filtrelenmiş kelimeleridir.[1] Genelde etkisiz kelimeler bir dildeki sık kullanılan kelimeleri kapsar, etkisiz kelimeler için işleme araçları tarafından kullanılan tek evrensel bir liste bulunmamaktadır, hatta tüm araçların böyle bir liste kullandığı bile söylenemez. Bazı kullanılan araçlar cümle aramalarını daha iyi destekleyebilmek için etkisiz kelimelerin çıkarılmasından kaçınmaktadır.

Herhangi bir kelime grubu, belirli bir amaç için etkisiz kelime olarak seçilebilir. Bazı arama motorlarında için İngilizcede en yaygın, kısa işlevsel kelimeler söyledir ; “such as”, “the”, “is”, “at”, “which” ve “on”. Bu durumlarda belirtilen etkisiz kelimelerin olduğu cümleler ve isimler arandığında bazı sorunlar yaşanmaktadır, adların bazıları ; "The Who", "The The" veya "Take That". Diğer arama motorları performanslarını arttırmak için bazı genel kelimeleri de – sözlüksel kelimeler de buna dahildir, “want” (istemek) kelimesi gibi- çıkarmaktadırlar.

Bilgi erişim öncülerinden biri olan Hans Peter Luhn, bu ifadeyi icat etmek ve kavramı kullanmakla tanınır.[2] Luhn'un 1959'da yaptığı konuyla ilgili sunumunda olmamasına karşın terimin İngilizcesistop word ve ilgili diğer terimler olan stop list ya da stoplist kısa süre içinde literatürde kullanılmaya başlanmıştır.[3]

Arama motoru optimizasyonu terminolojisinde, etkisiz kelimeler çoğu arama motorunun, robotların ya da dizinleyicilerin geniş ölçekli veri işlemesi sırasında hem zaman hem de yer tasarrufu açısından kaçındığı sıkça kullanılan kelimelerdir. Bu arama motorlarına veritabanlarında yer tasarrufu konusunda yardımcı olur.[4]

Ayrıca bakınız

Kaynakça

  1. ^ Rajaraman, A.; Ullman, J. D. (2011). "Data Mining" (PDF). Mining of Massive Datasets. ss. 1-17. doi:10.1017/CBO9781139058452.002. ISBN 9781139058452. 
  2. ^ Luhn, H. P. (1959). "Keyword-in-Context Index for Technical Literature (KWIC Index)". American Documentation. 11 (4). Yorktown Heights, NY: International Business Machines Corp. ss. 288-295. doi:10.1002/asi.5090110403. 
  3. ^ Flood, Barbara J. (1999). "Historical note: The Start of a Stop List at Biological Abstracts". Journal of the American Society for Information Science. 50 (12). s. 1066. doi:10.1002/(SICI)1097-4571(1999)50:12<1066::AID-ASI5>3.0.CO;2-A. 
  4. ^ "Stop Words and Impact on SEO - Search Engine Nation". Search Engine Nation (İngilizce). 24 Nisan 2018. 26 Ağustos 2018 tarihinde kaynağından arşivlendi. Erişim tarihi: 24 Mayıs 2018. 

Dış bağlantılar

  • İngilizce Etkisiz Kelime Listesi (PHP, CSV) 3 Ocak 2016 tarihinde Wayback Machine sitesinde arşivlendi.
  • Full-Text Etkisiz Kelimeler MySQL 15 Ekim 2019 tarihinde Wayback Machine sitesinde arşivlendi.
  • İngilizce Etkisiz Kelimeler (CSV) 30 Kasım 2016 tarihinde Wayback Machine sitesinde arşivlendi.
  • Hintçe Etkisiz Kelimeler
  • Almanca Etkisiz Kelimeler 15 Eylül 2016 tarihinde Wayback Machine sitesinde arşivlendi., Almanca Etkisiz Kelimeler ve Deyimler
  • Lehçe Etkisiz Kelimeler (Polonya Dili)
  • 29 dilde etkisiz kelimeler koleksiyonu 28 Eylül 2015 tarihinde Wayback Machine sitesinde arşivlendi.[1]
  • Kavita Ganesan tarafından Etkisiz Kelimelerin ayrıntılı açıklaması 24 Aralık 2015 tarihinde Wayback Machine sitesinde arşivlendi.