Bilgisayar Destekli Çeviri Sistemleri

Bilgisayar Destekli Çeviri (BDÇ) sistemleri, çevirmenlerinin hızını ve tutarlılığını arttırmak amacıyla oluşturulan yazılım uygulamalarıdır, böylece BDÇ sistemleri, sözleşmeli çevirmenlerin kazançlarını ve kabul edilebilir kalite düzeyini korurken çeviri projelerinin genel maliyetlerini de düşürmektedir. Özünde, her BDÇ sistemi bir metni "segmentlere" (noktalama işaretleriyle ayrılan cümleler) ayırır ve aynı (tam eşleşme) veya benzer (bulanık eşleşme) kaynak ve çeviri segmentleri için iki dilli bir bellekte arama yapar. Benzer iki dilli sözlüklerde terminolojinin araştırılması ve tanınması da varsayılan özelliktir. İlgili arama sonuçları daha sonra uyarlama ve tekrar kullanım için çevirmene önerilir

     

BDÇ sistemleri 1990'ların başından itibaren, diğer dillere ve pazarlara (yerelleştirme) yönelik ürün ve hizmetler için artan şirket ve kurum ihtiyacına cevap vermek üzere geliştirilmiştir. Çok fazla belge ve kısa süreli teslim tarihleri ​​(eşzamanlı veya kısa süreli teslimat) dolayısıyla, aynı kaynak materyalinde çevirmen ekiplerin aynı anda çalışması gerekmiştir. Bu bağlamda, incelenen terimleri yeniden kullanma ve sürekli olarak aynı terminolojiyi uygulama becerisi çok önemli bir hale gelmiştir. 1990'lı yıllarda teknik çeviri ve büyük yerelleştirme projeleri ile sınırlı olan BDÇ sistemleri, çoğu çeviri türüne hitap edecek şekilde geliştirilmiştir ve profesyonel olmayanlar da dahil olmak üzere çoğu çevirmen artık bu sistemlerden faydalanabilmektedir.

 

BDÇ sistemlerine bu genel bakış, yalnızca çeviriyi temel alarak özel olarak tasarlanmış bilgisayar uygulamalarını içermektedir. Kelime işlemcileri, imla ve dilbilgisi denetleyicileri ve kesinlikle çevirmenlere büyük yardım sağlayan ama daha geniş bir kullanıcı tabanı için geliştirilmiş diğer elektronik kaynakları içermemektedir. Genel kullanımdaki bir BDÇ sisteminde yer alan özelliklerin benzerlerine sahip olmasına rağmen, hesaplama dilbilimciler için geliştirilmiş olan uygulamaları da içermemektedir.

 

Bu makale, çeviri odaklı bilgisayar sistemleri arasından, çevirmenlere, bir makine tarafından oluşturulmuş çevirileri tam olarak sağlayabilen uygulamalar yerine, yalnızca çevirmen aracılı çözümlerle çalışan uygulamalara odaklanılacaktır. Bunun gibi Makine Çevirisi (MÇ) yardımları, yalnızca günümüzün BDÇ sistemlerinde isteğe bağlı tamamlayıcı olarak kullanılma artışı göstermeleri bağlamında ele alınacaktır.

 

BDÇ sistemleri, temel olarak, çeviri belleği (ÇB) olarak adlandırılan veri tabanlarında tutulan geçmiş çevirilerin (insan çevirisi) yeniden kullanılmasını ve terminoloji veritabanlarında tutulan terminolojinin otomatik olarak uygulanmasını sağlamaktadır. Bu temel işlevsellikler, daha önce çevrilmiş belgelerden ÇB veritabanları oluşturmak için kullanılan hizalama araçları, ÇB’lerden aranabilir terim tabanları oluşturmak için kullanılan terim çıkarma araçları, iki dilli sözlükler ve diğer belgeler ile tamamlanabilmektedir. BDÇ sistemleri, aynı zamanda, etiketli dosyalardan çevrilebilir metnin çıkarılmasına yardımcı olabilmekte ve temel dilbilim ve mühendislik çiftinin kalite güvencesini sağlarken, çok sayıda ve tipteki dosyaların, çevirmenlerin, dil çiftlerinin ve karmaşık çeviri projelerinin yönetilmesinde yardımcı olmaktadırlar.

 

BDÇ Sistemleri, BDÇ araçları, ÇB’ler, ÇB araçları (veya sistemleri veya araçları), çevirmen panelleri veya çalışma alanları, çeviri destek araçları veya son çeviri ortam araçları (TEnTs) olarak hem endüstride hem de literatürde bilinmektedir. Sadece bir çekirdek bileşeni tanımlamasına rağmen, ÇB’nin anadili terimi yaygın bir şekilde kullanılmaktadır: insan-aracılı süreç için bir belirtke olarak ÇB, kesinlikle MÇ'ye karşı daha cazip ve muntazamdır. Bu arada, BDÇ kısaltması kurallara bağlı çeviri odaklı işlevsellik özelliklerini ve diğer daha genel özellikleri (kelime işlem, yazım denetimi vb.) kapsadığı için, bazı kişiler tarafından aşırı genel kapsamlı bir terim olarak görülmüştür.

 

Şu anda 'resmi' bir belirtke üzerinde fikir birliği bulunmamakla birlikte, çevirmenlerin yaygın olarak bugünkü iş hayatlarında karşılaşacağı araçları belirlemek için BDÇ kısaltması kullanılacaktır. Bu belirtkeye dahil olarak, "geleneksel" kullanıcı yardımı ve teknik metin yerine, yazılımlardaki kullanıcı arayüzlerinin çevrilmesine odaklanan ve belirli bir alt tür olan yerelleştirme araçları da ele elınacaktır. Çeviri Belleği veya ÇB, kaydedilen çevirilere veritabanı olması yönüyle gerçek ve tam anlamıyla anlatılacaktır.

 

Tarihsel olarak, BDÇ sisteminin gelişimi plansızdı, bunun yerine en yoğun çaba ve araştırma MÇ için yapılıyordu. BDÇ, öncü geliştiricililer olan çeviri ajansları, kurumsal yerelleştirme departmanları ve bireysel çevirmenlerle birlikte, işlem gücünün (büyük bilgisayarlara karşı kişisel bilgisayarlar) ve algılanan çeviri ihtiyacının demokratikleşmesine cevaben organik olarak büyüdü. Bazı sistemler sadece kurum içi kullanım için diğerleri ise satılmak için üretiliyordu.

 

Hutchins’in Çeviri Yazılımları İncelemesinde: Ticari Makine Çeviri Sistemleri Rehberi ve Bilgisayar Destekli Çeviri Destek Araçları listesindekilerin (1999'dan itibaren) hepsi piyasada satın alınabilecek mevcut tüm makine çevirisi ve bilgisayar destekli çeviri destek araçlarıydı (Hutchins 1999−2010: 3). Bu derlemede, BDÇ sistemleri "Terminoloji yönetim sistemleri", "Çeviri belleği sistemleri/bileşenleri" ve "Çevirmen iş alanları" başlıkları altında yer almaktaydı. Ocak 2005 itibariyle, söz konusu kategoriler sırasıyla 23, 31 ve 9 ürünle (birkaç çakışma ile) övünüyordu ve bazılarına son verilmesine ve yenilerinin oluşturulmasına rağmen, son on yılda genel rakamlar çok fazla değişmemiştir. Bazı incelemeler endüstride büyük bir iz bırakırken, diğerleri geliştiricisinin iç çevresinin dışında bile çıkamamıştır.

 

Cümle düzeyinde parçalara ayırma etrafında dönen temel teknoloji, 1990'ların ortalarında tamamen gelişmiştir. Önde gelen markaların teklifleri daha sonra kapsamlı bir şekilde artacaktı, ancak on yıldan fazla bir süre boyunca kazanımlar, daha fazla dil-veri kaldıracı elde etmek için kayda değer yeni yollardan daha çok istikrar ve işlem gücüne odaklanmıştır. Bunu bir sonraki bölümde ele alınan klasik dönem olarak adlandırmaktayız. 2005'ten itibaren metni yeniden kullanımına yönelik daha ayrıntılı bir yaklaşım ortaya çıkmıştır; adreslenebilir veri miktarı ve BDÇ kullanımı için olası durumlar arttırılmıştır. Bu yeni trendler Güncel BDÇ Sistemleri bölümünde incelenmiştir.

 

Klasik BDÇ sistemleri (1995−2005)

 

Çeviri sürecine yardımcı olan bilgisayar fikri, 1999'un başında başlayan Makine Çevirisi’nin gelişimi ile doğrudan bağlantılıdır. Hepimizin bildiği gibi, BDÇ'ye yapılan belgesel referanslar, Amerika Birleşik Devletleri'ndeki ilk büyük MÇ finansman fonunu durduran 1966 tarihli Otomatik Dil İşleme Danışma Komitesi (ALPAC) raporunda zaten bulunmaktadır. Elektron tüplü bilgisayarlar ve delikli kartlar çağında, rapor, MÇ'nin (o zamanlar mekanik çeviri olarak bilinen) geleneksel yöntemden daha fazla zaman alıcı ve pahalı bir süreç olduğunu öne sürmüştür, daha sonra kâtipe yazdırma yoluyla süreç kolaylaştırılmıştır. Ancak rapor, Hesaplamalı Dilbilim için finansman sağlamış ve özellikle “makine destekli insan çevirisi” olarak adlandırılan sistem daha sonra Mannheim'daki Federal Silahlı Kuvvetler Çeviri Bürosu tarafından uygulanmıştır. Raporda yer alan bir çalışma (Ek 12) elektronik sözlük kullanan çevirmenlerin hataları yüzde 50 azaltabileceğini ve verimliliği yüzde 50'nin üzerinde arttırabileceğini göstermiştir (ALPAC 1996: 26, 79-86).

 

BDÇ sistemleri, daha hızlı, daha ucuz ve yine de kullanışlı bir çeviri üretmeye gerçekten yardımcı olabilecek bir ürün tasarlamaya olanak sağlamadığı için MÇ geliştiricilerini hayal kırıklığına uğratmıştır. Terminoloji yönetim sistemleri, Mannheim'a kadar ulaşmışken, çevirileri veritabanına aktarma fikri, 1980'lere kadar ortaya çıkmamıştır. Daktilo dönemi boyunca, çevirmenler muhtemelen çalışmalarının kağıt kopyalarını saklamış ve ihtiyaç duyduklarında onları kullanmışlardır.Kişisel bilgisayarın ortaya çıkması, daha uygun bir şekilde sorgulanabilen elektronik kopyalı belge depolamayı beraberinde getirmiştir. Hiç şüphesiz, bilgisayarlar bir şekilde bu sorguları otomatikleştirmek için kullanılabilirdi ve bu da tam olarak 1980'lerin başında Kay ([1980] 1997: 323) ve Melby (1983: 174-177) 'nin önerdiği fikirdir.

 

1980'lerde, Salt Lake City, Utah'da ALPS (Otomatik Dil İşleme Sistemleri) tarafından geliştirilen Çeviri Destek Sistemi (TSS), BDÇ sisteminin ilk prototipi olarak kabul edilmektedir. Daha sonra bu prototip INK TextTools (Kingscott 1999: 7) markasıyla INK Hollanda tarafından yeniden tasarlanmıştır. Bununla birlikte, o zamanlar gerekli programlama aşırı karmaşık olmasa da, koşullar teknolojinin ticarileşmesi için henüz uygun hale gelmemiştir.

1990'ların başlarında bu değişmiştir: kelime işlemcili mikro-bilgisayarlar, çevirmenlerin masalarından daktiloyu yerinden etmiştir. Bazı çalışmaya hevesli ve teknolojik açıdan uzman çevirmenler bunu bir fırsat penceresi görmüştür. 1990 yılında, Hummel ve Knyphausen (1984'te Trados'u kurmuş olan ve TextTools'u kullanan iki Alman girişimci), MultiTerm terminoloji veritabanını piyasaya sürmüş ve bunu 1992'de Çevirmen Paneli ÇB aracının ilk sürümü takip etmiştir. Ayrıca 1992'de büyük dil servis sağlayıcısı STAR AG (Alman şirket) kendi kurum içi sistemi Transit'i piyasaya sürerken (Hutchins 1998: 418-419), Almanya UİM, kurum içi geliştirilmiş Çeviri Yöneticisi 2 ürününü ticarileştirmiştir.

 

Benzer ürünler kısa sürede sahaya girmiştir. İlk olarak 1993'te piyasaya sürülen Déjà Vu gibi bazı araçlar, bugün hala yerini korumaktadır; piyasaya sürüldüğünde (Brace 1992) iyi finanse edilen ve pazarlanan Eurolang Optimiser gibi ürünler kısa süreliğine kullanımdan kalkmıştır. Bütün ürünlerin arasından – 1996 ve 1997 yıllarında başarılı Avrupa Komisyonu ihale teklifleri sayesinde - ana oyuncuların seçim aracı ve dolayısıyla varsayılan endüstri standardı Trados olmuştur.

 

1990'ların ortasına gelindiğinde, çeviri belleği, terminoloji yönetimi, hizalama araçları, dosya dönüştürme süzgeçleri ve diğer özellikler daha gelişmiş sistemlerde bulunmaktaydı. BDÇ teknolojisinin, önümüzdeki 10 yılda fazla değişmeyecek olan ana bileşenleri aşağıda açıklanmaktadır.

 

Editör

 

BDÇ sistemleri, çevirmenlerin çeviri belleği veritabanlarından çevirileri yeniden kullanmasına ve terminoloji veritabanlarından terminoloji kullanmasına imkan vermektedir. Editör, çevirmenlerin bir kaynak dosya açmak için kullandıkları sistem önyüzüdür. İlgili veriler için çeviri belleğini ve terminoloji veritabanlarını sorgulamaktadır. Ayrıca, herhangi bir eşleşme bulunmazsa çevirmenlerin kendi çevirilerini yazabilecekleri çalışma alanı ve bitmiş cümle çiftlerini çeviri belleğine, terminoloji çiftlerini de terim veritabanına gönderme arabirimidir.

Bazı klasik BDÇ sistemleri, editörlerini genellikle Microsoft Word gibi üçüncü parti bir kelime işlem yazılımıyla çalıştırmışlardır. Trados ve Wordfast, klasik dönemde bunun en iyi bilinen örnekleriydi. Ancak çoğu sistem, kendisine ait bir editör kullanmaya karar vermiştir. Word gibi bir kelime işleme paketinin kullanılmasının bariz avantajı, kullanıcıların arayüze aşina olmasıdır. Bununla birlikte, bariz dezavantajı, bir dosyanın Word'de normal olarak açılamadığında, çevirilebilir içeriğini çıkarabilen bazı aracı uygulamalarda ön işlemeden önce metnin tercüme edilememesidir. Bununla beraber, kişiye özel editörler, sonuçları görüntülemek için Word'e bağımlı olmadan, böyle bir ara adımı zaten içermektedir.

 

Bağımlı veya bağımsız bir BDÇ sistemi editörü ilk olarak kaynak dosyayı çeviri birimlerine ayırıp, çevirmenin ayrı ayrı üzerinde çalışmasını ve programın hafızada eşleşme aramasını sağlamaktadır. Editör penceresinde çevirmen, seçili kaynak metin parçası ile sistemin herhangi bir eşleşmeyi bellekten aktaracağı ve/veya çevirinin sıfırdan yazılmasına olanak tanıyacağı çalışma alanını görmektedir. Çalışma alanı, aktif segmentin altında (dikey görünüm) veya yanında (yatay veya tablo şeklinde görünüm) görünebilmektedir.

 

Her iki görünümde de, sözcük makrosu ve daha sonra özel “Etiket Düzenleyici” olan klasik Trados için iş akışı, dikey görünüme model oluşturmaktadır. Çevirmen bir segment açar, uygunsa eşleşmelerden yardım alır, sonra bu segmenti kapatır ve bir sonrakini açar. Açık segmentle ilgili ÇB ve terim bilgisi, Çevirmen Paneli adlı ayrı bir pencerede gözükmektedir. Aktif segmentin üstünde ve altında gözüken aktif olmayan segmentler eş bağlamlarıyla birlikte çevirmene gösterilmektedir. Çeviri tamamlandıktan ve gözden geçirildikten sonra, sonuç, tek dilli hedef dil dosyası olarak "temizlenmesi" gereken iki dilli "temizlenmemiş" bir dosyadır. Bu model en başta Wordfast olmak üzere diğer sistemler tarafından uygulanmıştır.

 

Kaynak metin yan yana, tablo biçiminde gösterildiğinde, klasik örnek olarak Déjà Vu’da, çevirmen, imleci karşılık gelen hücreye yerleştirerek belirli bir segmenti aktifleştirir; arama ayarlarına (kullanıcı tarafından ayarlanabilen) bağlı olarak, en alakalı veritabanı bilgileri, sağdaki hedef hücreye, kenar çubuğunda veya ekranın altında gösterilen ek bellek ve terim verileriyle birlikte aktarılır.

 

Editörün çevrilebilir metni gösterişinden bağımsız olarak, çevirmenler etkileşimli modda veya çeviri öncesi modda çalışmaktadırlar. Kendi belleklerini ve sözlüklerini kullanırken, her segment "canlı" olarak oluştuğu için, ilgili bilgileri veritabanlarından alan programla, genellikle, etkileşimli modda çalışmaktadırlar. Bellekler ve sözlükler, bir kurum veya müşteri tarafından  verildiğinde, kaynak metin önce bunlara karşı analiz edilir ve daha sonra ilgili girdiler sıralanır ve çevirmenlere gösterilir veya ön çeviri olarak bilinen bir süreçle doğrudan kaynak dosyaya eklenir. Çevirmenler, etkileşimli modu tercih ederler, ancak bu dönemde, büyük projelerin çoğu, ön çeviri sürecinden geçmekteydi (Wallis 2006).

 

Çeviri Belleği

 

Trados kurucuları Knyphausen ve Hummel'e atfedilen orijinal sözcük, bir çeviri belleği veya ÇB, geçmiş çevirileri içeren, hizalanmış, kaynak ve hedef birim çiftlerini eşleştirmede yeniden kullanıma hazır olan bir veritabanıdır. Görmüş olduğumuz üzere, temel veritabanı birimine segment denir ve normalde belli bir noktalama işareti ile ayrılmaktadır - bu nedenle genellikle bir cümledir, ancak aynı zamanda bir başlık, simge veya bir tablo hücresinin içeriği de olabilmektedir.

 

Bazen çeviri birimi veya ÇB olarak adlandırılan normal bir Çeviri Belleği girişi, çevirisiyle beraber bir kaynak bölümden ve ilgili üstverilerden (ör. zaman/tarih ve yazar kaşesi, müşteri adı, konu, vb.) oluşmaktadır. Çeviri Belleği  uygulaması ayrıca, aynı veya benzer bir segment yeni bir metinde ortaya çıkarsa, eşleşen bir çeviriyi alma algoritmasını da içermektedir.

 

Çevirirmen, editör penceresinde bir segment açtığında, program bunu veritabanındaki mevcut girdilerle karşılaştırmaktadır:

  • Veritabanında, çevirmenin üzerinde çalıştığı segmentle tam olarak örtüşen bir kaynak segmenti bulursa, karşılık gelen hedefi tam bir eşleşme (veya %100'lük bir eşleşme) olarak almaktadır; Çevirmenin yapması gereken şey verinin yeniden kullanılabilir olup olmadığını veya bazı küçük değişiklikler gerekip gerekmediğini kontrol etmektir.

  • Editör, veritabanında aktif olana benzeyen bir kaynak segment bulursa, hedefi, benzerlik derecesiyle birlikte, yüzdelik olarak belirtilen ve Levenshtein mesafe algoritması ile hesaplanan, örn. eşit hale getirmek için gereken minimum ekleme, silme veya değiştirme sayısı ile birlikte bir bulanık eşleşme olarak sunmaktadır; çevirmen daha sonra kolaylıkla uyarlanıp uyarlanamayacağını veya çeviriyi baştan yapmanın daha az çaba gerektirip gerektirmeyeceğini belirlemektedir; Genellikle, sadece %70'lik eşiğin üzerindeki segmentler önerilmektedir, çünkü daha düşük olanlar yararlıdan çok dikkat dağıtıcı olarak görülmektedir.
  • Önceden ayarlanmış eşleşme eşiğini aşan herhangi bir kayıtlı kaynak segmenti bulamazsa, hiçbir öneri sunulmamaktadır; Buna “eşleşme yok” denmektedir ve bu durumda çevirmenin söz konusu segmenti geleneksel yolla tercüme etmesi gerekmektedir.

 

Belli bir proje için bir çeviri belleğinin yararlılığı, yalnızca veri tabanındaki segment sayısına bağlı olmayıp (ne kadar fazlaysa o kadar iyi), aynı zamanda kaynak materyalle ne kadar ilgili olduğuna (ne kadar ilgiliyse o kadar iyi) da bağlıdır. Açıkçası, çeviri belleğinin hacmi her zaman özgün bir metnin çevirisinin doğruluğunu arttırmamaktadır.

 

Buna göre, BDÇ araçlarının çoğu, kullanıcıların istedikleri kadar çeviri belleği oluşturmalarına izin vermektedir - böylece her bir ÇB'nin belirli durumlarda (belirli bir konu, müşteri, vb.) kullanım için ayrılmasına ve iç tutarlılığın sağlanmasına izin verilmektedir. Aynı zamanda, internette serbest çalışanlar arasında, birden fazla çeviri belleği içeriğini, komik bir jargon olarak bilinen ‘big mama’ yöntemiyle tek bir ÇB’de toplama da yaygın bir uygulama olmuştur.

 

Şüphesiz, herhangi bir aktif ÇB sürekli geliştirilmektedir çünkü çevirmen bir metin üzerinde çalıştığı sürece segment sayısı artmakta, her çevirilmiş segment varsayılan bir veri olarak veritabanına gönderilmektedir. Ne kadar iç tekrar varsa, çeviri belleği de o kadar faydalıdır. Catchcry’nin de dediği gibi “ÇB ile kimse aynı cümleyi iki kez tercüme etmeyecek”. Çoğu zaman çeviri belleğinin yeniden kullanımı, bir ürün ya da hizmet, değiştirildikten sonra güncellendiğinde gerçekleştirilmektedir – Söz konusu teknik çeviri (Yardım dosyaları, kılavuzlar ve belgeler) olduğunda, tutarlılık çok önemlidir ve terim tekrarı, biçemsel olarak hata yerine meziyet olarak kabul edilmektedir.

 

Çeviri bellekleri için kurallara bağlı cümle temelli bazı teknik değişiklikler olmuştur. Star-Transit, eşleşmeleri bulmak için dizinlenen referans materyalleri için dosya çiftlerini kullanmıştır. Kanadalı geliştiriciler, ‘bi-text’ kavramını ortaya atmış, bu da eşleşmeyi ayrı bir cümle olarak almak yerine, tüm belgeye bağlayarak, doğru bağlamı sağlamıştır. LogiTerm (Terminotix şireketine ait) ve MultiTrans (MultiCorpora şirketine ait), metin tabanlı ÇB olarak nitelendirilmeleriyle böyle çalışan uygulamalara en iyi ve güncel örneklerdir. Bununla birlikte, şu anki sistemlerde, aynı bağlamdan gelen tam eşleşmeyi, tür, içerik, %101 garantili veya mükemmel eşleşmeye bağlı olarak adlandırıp gösteren klasik ÇB’de metin veya cümle üzerindeki vurgular arasındaki ayrım çizgisi bulanıktır; ve metnin dışa aktarılıp cümle tabanlı belleklerle çalışılmasına imkan tanınmaktadır. Şu anki bütün sistemler, Yerelleştirme Endüstrisi Standartları Birliği (LISA)’nin özel ilgi grubu olan OSCAR (İçeriğin Yeniden Kullanımına İzin Veren Açık Standartlar) tarafından oluşturulan açık XML standardı olan Çeviri Belleği Değişim (TMX) formatında içe/dışa bellek aktarımı yapabilmektedir.

 

Terminoloji Özelliği

 

Veri tabanını tam olarak kullanabilmek için, her BDÇ sisteminde terminoloji özelliği bulunmalıdır. Bu özellik, çeviri belleğinin yeniden kullanılabilen segmentlerine kavramsal olarak benzetilebilir, ama aslında, terim düzeyindeki klavuz verilerle birlikte belirli kaynak ve hedef terim çiftlerini içeren aranabilen/tekrar kullanılabilen sözlüklerin yönetimine verilen isimdir.

 

Çeviri belleğinde olduğu gibi, terminoloji özelliğinde de editördeki aktif çeviri segmenti bir veritabanında aranmaktadır - yani iki dilli bir sözlükte. Bir kaynak terim eşleşmesi algıladığında, karşılık gelen terim gösterilmektedir. Çoğu sistem, morfolojik ekleri karşılamak için bazı bulanık terminoloji tanıma işlemleri de uygulamaktadır.

 

Çeviri belleğinin tersine, terminoloji özelliğinde daha çok veri her zaman daha faydalı değildir: erek terim, kaynak terim kadar özgün olmalı, ve sözlük, belirlenmiş alanla, müşteriyle ve projeyle olabildiğince alakalı olmalıdır. Bu nedenle, belirli kullanımlar için (ve tabii ki belirli aralıklarla ’big mama’ terim bankasına atmak için) parçalanabilecek şekilde saklanan çoklu terim tabanlarının derlenmesi süregelen bir uygulamadır.

 

Terim tabanları, oluşturan kişilere ve amaçlarına bağlı olarak farklı biçimlerdedir. Bazı BDÇ sistemlerinin kişisel ve kurumsal versiyonlarında sunulan işlevsellikler bu ihtiyaçları yansıtmaktadır.

 

Serbest çevirmenler, kaynak ve hedef terim eşleşmelerini girerek − genellikle uzun yıllar boyunca − elle oluşturdukları iki dilli sözlükleri tercih etmektedirler. Girdiler normalde yerel bilgisayar belleğinde saklanmakta ve uzun süreli bir onarım yapılmadıkça veriler kayıtlı kalmaktadır. Bir yetinmeci yaklaşım, çevirmenlerin kendi bilgi ve deneyimleriyle desteklediği sınırlı üstverilerle (veya bu üstveriler olmadan) farklı bağlamlar için kolaylık ve esneklik sağlayabileceklerini öne sürmektedir.

 

Aksine, büyük şirketler, toplu, çok dilli terim tabanları oluşturmak ve sürdürmek için eğitimli terminoloji uzmanlarını barındıran özel büroları yönetebilir. Böylece, terim tabanları herhangi bir kullanıcıya yardımcı olmak için eşanlamlı terimler, tanımlar, kullanımsal örnekler, resimli bağlantılar ve harici bilgiler ile güçlendirilecektir. Büyük kurumsal projeler için, sözleşmeli çevirmenlerin veya kurumların uyması zorunlu kılınan, belirlenmiş anahtar terimlerin değişmez kullanımlarından oluşan ürüne özel sözlükler oluşturmak da süregelen bir uygulama olmuştur.

 

Sözlükler değerli kaynaklardır, ancak sözlükleri veritabanı alışverişi yoluyla hızlı bir şekilde derleme işlemi, depolama biçimlerindeki farklılıklar nedeniyle karmaşık olabilir. Bu nedenle, BDÇ sistemlerinde genellikle elektronik tablolardan, basit metin dosyalarından ve hatta TMX gibi ara biçimlerden dışa/içe aktarmaya izin verilmektedir. Bu her zaman üstverinin bir kısmının ya da tamamının kaybına ya da bozulmasına yol açmaktadır. Geliştirilmiş değişim özelliğiyle, Terminoloji Tabanı Değişim (TBX) açık standardı nihayetinde OSCAR/LISA tarafından üretilmiştir. Günümüzde en karmaşık sistemler bile TBX uyumludur.

 

Geleneksel olarak ÇB'lere yapılan vurguya rağmen, deneyimli kullanıcılar çoğu zaman en büyük yardımı terminoloji özelliğinin sağladığını iddia etmektedirler. Çeviri belleklerinin, tekrar eden metinlerdeki değişikliklerle birlikte en iyi şekilde çalıştığını düşünmek anlaşılabilir bir durumdur. Buna karşın, tekrarlayan terminoloji, tutarlılığın çok önemli olduğu birçok durumda görünebilmektedir.

 

İlginç bir şekilde, terminoloji özellikleri – bariz bir biçimde çekirdek bileşenler olsa da - belirli bir BDÇ sisteminde her zaman "bütünleşik"  bulunmamaktadır. Trados, şirketinin çeviri belleği (eskiden Çevirmen Paneli olan) uygulamasının yanında bağımsız bir uygulama olarak sunduğu MultiTerm aracıyla buna bir örnektir. Diğer yandan Déjà Vu, kendine özgü arayüzü ile, başlangıcından beri her şeyi bir araya toplamıştır.

 

Her iki durumda da, kullanıcı arayüzleri arasında sözcük tutarlılığını sürdürmek isteyen kurumlar ile, yardım dosyalarını, belgeleri, ambalajlama ve pazarlama materyallerini terminoloji özelliği olmadan çevirmek anlaşılmaz hale gelmiştir. Gerçekten de, belirli bir sözcüğün kullanılması o kadar kurallara bağlıdır ki, birçok BDÇ sistemi, çevirmenler belirli bir terim tabanındaki genel kullanıma uymadığında hata bayrağı gösteren anonim kalite güvencesi (QA) özelliklerine sahiptir.