भाषाविज्ञान
और सूचना पुनर्प्राप्ति
तकनीकी
साहित्य से जानकारी की
पुनर्प्राप्ति जैसा कि अभ्यास में
किया जाता है
पेटेंट
कार्यालय चीजों की विशिष्टता की
तुलना में चीजों के विशिष्ट अंतर्संबंधों
से कहीं अधिक चिंतित है।
इस
साहित्य में, कोई दो दस्तावेज़ जो
समान या को संदर्भित
करते हैं
निकट
से मिलती-जुलती घटनाएँ आम तौर पर
इन घटनाओं को व्यक्त करेंगी
मौखिक
अभिव्यक्तियों के दो व्यापक
रूप से भिन्न सेट।
एक पेटेंट परीक्षक
जो
लोग पुनर्प्राप्ति अनुरोध तैयार करने में एक समान घटना
की खोज कर रहे होंगे,
वे शायद अभी भी अलग, लेकिन
सटीक का उपयोग करेंगे,
मौखिक
अभिव्यक्ति. इसलिए, दस्तावेज़ों को पुनः प्राप्त
करने के लिए, दोनों
अनुरोध
और दस्तावेज़ों को एक सामान्य
रूप में लिप्यंतरित किया जाना चाहिए
भाषाई
विभाजक.
.
रिश्तों
सहित खुलासा करने का हमारा तरीका
उसमें
पाया गया, आइटमीकरण कहा गया है। इस व्यवस्था में
प्रत्येक वस्तु
एक
अलग आइटम के रूप में
सूचीबद्ध है. अतिरिक्त वर्णनकर्ता जो अन्य बताते
हैं
प्रत्येक
चीज़ के पहलुओं को
एक ही आइटम में
सूचीबद्ध किया गया है। वस्तुओं के बीच संबंध
अंतर्संबंध संबंधी अवधारणाओं के माध्यम से
दिखाया गया है, जो दर्पण-छवि
के रूप में गढ़ी गई है, छवियों
में से एक को
वितरित (सूचीबद्ध) किया जा रहा है
प्रत्येक
चीज़ संबंधित हो रही है।
क्रियाओं का भी वितरण
किया जाता है
इसमें
शामिल प्रत्येक चीज़। वितरित शब्दों को समान संख्याओं
द्वारा पहचाना जाता है, जिन्हें इंटरफिक्स कहा जाता है।
हम
वर्णनकर्ता के रूप में
उपयोग करने के लिए रूली
अंग्रेजी मूल गढ़ रहे हैं। इन
प्रक्रिया,
वस्तु जैसी धारणाओं को इंगित करने
के लिए जड़ों को संशोधित किया
जा सकता है
संसाधित,
वस्तु प्रसंस्करण, स्थिति और संख्या। क्रिया
शब्दों की मूल जड़ें
सभी चीजों में परिवर्तन को शामिल करने
के लिए गढ़ी गई हैं
कार्रवाई
में हिस्सा. पूरक शब्दों को शामिल करने
के लिए क्वालीफायर की मूल जड़ें
भी गढ़ी गई हैं। क्वालिफायर
के परिमाणीकरण का एक सरल
समाधान प्रस्तावित है।
भाषाई
दृष्टिकोण
भंडारण
पर अपने शोध में हमारे कार्यालय द्वारा अपनाए गए दृष्टिकोणों में
से एक
और
तकनीकी साहित्य में जानकारी की पुनर्प्राप्ति प्रकृति
में भाषाई है। यह भाषाई जाँच
दो कारणों से की गई
थी।
अधिकांश
वैज्ञानिक और तकनीकी साहित्य
पहले से ही मौखिक
रूप से व्यक्त किया
गया है,
और
यह स्पष्ट है कि चित्र,
तालिकाओं के रूप में
अन्य संदर्भ
आंकड़े,
तस्वीरें, मॉडल, कामकाजी मशीनरी इत्यादि को उनके मौखिक
समकक्षों में लिप्यंतरित किया जा सकता है।
यह भी बिल्कुल स्पष्ट
है कि नहीं
इससे
कोई फर्क नहीं पड़ता कि अंततः सूचना
पुनर्प्राप्ति की कौन सी
अंतिम योजना या विधि विकसित
की गई है, एक
"स्पष्ट" धातुभाषा मूल्यवान पाई जाएगी। चूंकि पारंपरिक भाषाई विश्लेषण हमारी तकनीकी समस्याओं के समाधान में
मददगार साबित नहीं हुआ, इसलिए हमने कदम उठाना आवश्यक पाया। एक ऐसी धातुभाषा
का निर्माण शुरू करना जिसमें प्रत्येक इकाई का एक, और
केवल एक ही अर्थ
होगा, और जिसमें प्रत्येक
अर्थ को एक, और
केवल एक इकाई के
साथ व्यक्त किया जा सकता है।2
यह धातुभाषा और
इसके उपयोग के लिए प्रस्तावित
विधि निस्संदेह प्रशिक्षित भाषाविदों को अपरंपरागत प्रतीत
होगी; हालाँकि, तिथि निर्धारण का प्रयोग सूचना
पुनर्प्राप्ति में कुछ पेटेंट कार्यालय समस्याओं के अंतिम समाधान
की ओर इशारा करता
है। जिन्होंने बताया है कि अंग्रेजी
काफी "अनियंत्रित" है। ऐसी धातुभाषा में सूचना पुनर्प्राप्ति में कम से कम
दो परस्पर अनन्य उपयोग होंगे। यंत्रीकृत सूचना पुनर्प्राप्ति
पेटेंट
कार्यालय में हमारे काम में हमारी बहुत अधिक रुचि है
चीजों
के अंतर्संबंध की तुलना में
हम स्वयं व्यक्तिगत चीजों के विशिष्ट विवरण
में हैं। कोई दो तकनीकी दस्तावेज़
जो संदर्भित हों
समान
या निकट से मिलती-जुलती
घटनाओं को आम तौर
पर व्यक्त किया जाएगा
मौखिक
अभिव्यक्तियों के दो व्यापक
रूप से भिन्न सेटों
में ये घटनाएँ,
ये
दोनों सटीक रूप से मानव तक
एक ही जानकारी पहुंचाते
हैं
दिमाग।
एक यंत्रीकृत खोज प्रणाली का उपयोग करने
में, एक पेटेंट परीक्षक
इसी
जानकारी की पुनर्प्राप्ति के
लिए अपना अनुरोध तैयार कर सकता है
अभी
भी भिन्न, लेकिन सटीक मौखिक अभिव्यक्ति का उपयोग करके।
यदि उसका
खोज
से दस्तावेज़, अनुरोध और आवश्यक दस्तावेज़
दोनों प्राप्त होते हैं
प्रत्येक
को धातुभाषा संबंधी सामान्य विभाजक में लिप्यंतरित किया जाएगा।
यह
धातुभाषा पहली बार रूपांतरण को संभव बनाएगी
किसी
विशेष दस्तावेज़ में कई जटिल और
परस्पर संबंधित धारणाएँ
एकल
अनूठे रूपों में। इस तरह की
योजना मौलिक है
किसी
भी सफल पुनर्प्राप्ति प्रणाली का विकास।
खोज
अनुरोध डेटा स्वीकार करने के लिए एक
स्वचालित असेंबली प्रोग्राम सिस्टम में, ऐसे डेटा को एन्कोड करने
के लिए इन्हीं अद्वितीय शब्दों का उपयोग किया
जा सकता है
मशीन
निर्देश या कमांड के
लिए उपयुक्त रूप में। उपयोग
ऐसी
प्रणालियों को मशीन उद्योग
द्वारा व्यापक रूप से विकसित किया
जा रहा है
इस
पल।
एक
बार भाषा इकाइयों की शब्दावली और
परिभाषा हो गयी है
बनाया
गया है, खोज प्रश्नों की एन्कोडिंग महज
एक प्रतीत होती है
कार्यक्रम
विकास की समस्या.
