فایل ها پیوست شده
main.py کد منه
enamad_data.xlsx خروجی که میده
enamad.html سورس html اینماد واسه راحتی اضافه کردم که نری تو خود اینماد
خلاصه بگم کار این سورس اینه اطلاعاتی که میخوام از اینماد استخراج میکنه برای کار تبلیغاتی
حالا مشکلش اینه خروجی که میده بجز قسمت دامنه بقیشون اشتباهه
حالا کاری که میخوام انجام شه
میخوام هر کدوم از این لاینایی که از enamad.html میدم استخراج کنه
مالک 319 (فقط کلمات فارسی بدون کاراکتر اضافه)
ایمیل 420 ( به جای [at] @ قرار بگیره
نام 280 ( بدون شناسنامه کسب و کار و کاراکتر ')
و اینکه هر صفحه که استخراج کرد (یعنی سی سایت تا بررسی کنه بخواد بره صفحه بعدی)
یه بار WebDriver بسته شه و با لینک جدید باز شه.
این آگهی از وبسایت کارلنسر پیدا شده، با زدن دکمهی تماس با کارفرما، به وبسایت کارلنسر برین و از اونجا برای این شغل اقدام کنین.
هشدار
توجه داشته باشید که دریافت هزینه از کارجو برای استخدام با هر عنوانی غیرقانونی است. در صورت مواجهه با موارد مشکوک، با کلیک بر روی «گزارش مشکل آگهی» به ما در پیگیری تخلفات کمک کنید.