پایان نامه هوش مصنوعی و رباتیکز
پروپوزال و مقاله بیس را ضمیمه کردم
من از معماری trocr استفاده کردم
الان trocr base از معماری دیکدر ترسفورمر در بخش دیکدر استفاده کرده
ولی ،دیکدر اش را با وزنهای اولیه roberta large بارگزاری میکند ،و فقط قسمت کراس اتنشن را با وزنهای رندم پر میکنه و توکنایزر اش BPE است ،ولی روبرتا بر روی انگلیسی اموزش دیده
در فارسی،بهینه است ، توکنایزر چند زبانه یا خاص فارسی ویا توکنایزرهای دستی که کاراکتر بیس است استفاده شود ،و وزنهای اولیه دیکدر هم ماله همان توکنایزری باشد که انتخاب میکنیم
من در واقع،در قدم اول قبل از اینکه بخوام ترین بکنم ،نیاز است ،تحقیق بکنم در زبان فارسی
1-همان توکنایزر خود trocr
2- یا توکنایزر چند زبانه دیگر ،
2-یا توکنایزر خاص فارسی ،
3-یا توکنایزری که بر حسب کاراکتر
باشه ،
بهتر جواب میده؟
من در واقع دنباله پیدا کردن توکنایزر ی هستم که در زبان فارسی یا عربی بهتر از خود توکنایزر BPE عمل کنه ،اگر این رو بشه تحقیق بفرمایید ممنون میشم
و بعد یک ملیون داده دارم ،که هر چقدرش نیازه را میتونیم استفاده کنیم برای اثبات ادعامون
این آگهی از وبسایت پارسکدرز پیدا شده، با زدن دکمهی تماس با کارفرما، به وبسایت پارسکدرز برین و از اونجا برای این شغل اقدام کنین.
هشدار
توجه داشته باشید که دریافت هزینه از کارجو برای استخدام با هر عنوانی غیرقانونی است. در صورت مواجهه با موارد مشکوک، با کلیک بر روی «گزارش مشکل آگهی» به ما در پیگیری تخلفات کمک کنید.