نخستین نسخه از فارس نت شامل وردنت فارسی است که توسط آزمایشگاه پردازش زبان طبیعی دانشگاه شهید بهشتی و با حمایت مرکز تحقیقات مخابرات ایران ساخته شده است. این محصول در بسیاری کاربردهای پردازش زبان فارسی ازجمله ترجمه ماشینی، خلاصه سازی اخبار، جستجو و بازیابی اطلاعات، کشف هرزنامه ها، تحلیل اطلاعات متون و رمزنگاری معنایی نقش کلیدی بازی می کند. فارس نت در بردارنده زیر مجموعه ای از واژگان مورد استفاده در زبان فارسی نوشتاری معیار است که علاوه بر امکان استفاده در سیستم های پردازش زبان فارسی امکانات تبدیل دوزبانه را نیز فراهم می کند. نخستین نسخه از این واژ-هستان شناسی شامل 10،000 مجموعه هم معنا و 18،000 کلمه فارسی است. کلمات تحت پوشش این محصول دارای 3 نوع مقوله نحوی (اسم، فعل و صفت) هستند و از بین پررخدادترین کلمات زبان فارسی انتخاب شده اند.
|