Osmanlıca Belgelerin Elektronik Çeviri Uygulamaları İçin Bir İmla Kılavuzu Örneği: Dervaze

Author:

Year-Number: 2017-Volume 5 Issue 3
Yayımlanma Tarihi: null
Language : Turkish
Konu : null
Number of pages: 78-84
Mendeley EndNote Alıntı Yap

Abstract

Bu çalışmanın amacı elektronik imla kılavuzu Dervaze'yi (dervaze.com) ve Osmanlıca metinleri Türkçeye, Türkçesini Osmanlıcaya çeviren morfolojik çeviri aracını tanıtmaktır. Dervaze'de halihazırda Osmanlı Türkçesine ait 72600 adet kelime yer almaktadır. Kelimelerin hem Latince hem Osmanlıca yazımı hem de ebced değerlerini sözlükte bulmak mümkündür. Elektronik bir kaynak olması dolayısıyla kelimelerin farklı ilişkileri (eşanlam, eşköken vs.) eklenebilmektedir ve benzer Osmanlıca yazılışa sahip kelimeleri listeleyebilmektedir. Bu imla kılavuzunun Osmanlı Türkçesi döneminin tüm söz varlığını barındırması planlanmaktadır. Dervaze aynı zamanda Osmanlı Türkçesiyle yazılmış metinleri günümüze kazandırmak için hazırladığımız çeviri programına da işlerlik kazandırmaktadır. Çeviri aracı Türkçe bir kelimenin morfolojik analizini yaparak, kök ve eklerini bulmakta, daha sonra bu kök ve ekleri ayrı ayrı Osmanlıcaya çevirmektedir. Türkçe ve Osmanlıca arasındaki yazım kuralları tam olarak birbirine çevrilemediği için bu yol tercih edilmiştir. Amaç Osmanlı Türkçesinin XIX. ve XX. yüzyıl metinlerini çevirmek olduğu için, imla kılavuzunun kaynakları da bu yönde belirlenmiştir. 1856 yılında yayımlanan Redhouse sözlüğü ve 1928 İmla Encümeni'nin kurallarına dayanan Belviranlı'nın Osmanlıca İmla Lügati tercih edilmiş, bununla birlikte İnternet'te bulunan çeşitli kelime listeleri de imla varyasyonlarını belirtmek amacıyla kullanılmıştır. İmla varyasyonları özellikle Osmanlı Türkçesinin imla kuralları çok net belirlenmemiş Türkçe unsurlarında önem kazanmaktadır. Bunların elektronik olarak tanınması ancak listelenmesiyle mümkündür ve bu nedenle tüm imla varyasyonları sözlük maddelerine dahil edilmiştir. Oluşturmakta olduğumuz sistemin OCR (Optik Karakter Tanıma) özellikleri kullanıma girdikçe, dönemin tüm kelimeleri asıl kaynaklardan taranacak ve farklı imlalar da kılavuzda yer alacaktır. XIX. yüzyıldan geriye doğru sürecek bir kaynak taraması çalışmasıyla, Osmanlı Türkçesinin söz varlığının tamamını kayda geçirmeyi hedeflemekteyiz.

Keywords

Abstract

The goal in this paper is to present Dervaze (dervaze.com), which is utilized in translation of Ottoman Turkish to Modern Turkish and vice versa through morphological analysis. As of today in the dictionary there are spellings of more than 72600 Ottoman Turkish words. Both Ottoman and Latin spellings, as well complementary information like Abjad values for the words are available. It is possible to search and model various relations between words (e.g. heteronymy, heterography) thanks to the digital nature of the dictionary. It is planned to store all Ottoman Turkish vocabulary in the dictionary. Dervaze underpins the translation facilities between historical Ottoman texts to Modern Turkish. The translation tool analyses the suffix and roots of Turkish words, then renders these separately in the target language. Such a technique is preferred because the most roots are irregular in Ottoman Turkish and there is no one to one mapping between these two orthographies. The primary objective in the dictionary is to translate XIX. and XX. century texts of Ottoman Turkish. Our initial sources are 1856 Redhouse Lexicon and Ali Kemal Belviranlı's spelling dictionary which relies on 1928 Spelling Committee's decisions. Various word lists available on the Internet are also added despite their poor quality to identify spelling variations. Spelling variations are especially important in Turkish origin words in Ottoman language, as there are no fixed spelling rules for them. It is required to list them in their entirety, as the one of the aspects of the dictionary is to provide a basis for an Optical / Intelligent Character Recognition system for the Ottoman language. As the OCR facilities become available we plan to extend the dictionary with all the primary sources automatically. Going back from XIX. century documents, we plan to include all vocabulary of Ottoman Turkish in the dictionary.

Keywords