site_javbus.py

from .entity_av import EntityAVSearch
from .entity_base import EntityActor, EntityMovie
from .plugin import P
from .site_util import SiteUtil

logger = P.logger


class SiteJavbus:
    site_name = "javbus"
    site_base_url = "https://www.javbus.com"
    module_char = "C"
    site_char = "B"

    @classmethod
    def __fix_url(cls, url):
        if not url.startswith("http"):
            return cls.site_base_url + url
        return url

    @classmethod
    def __search(cls, keyword, do_trans=True, proxy_url=None, image_mode="0", manual=False):
        keyword = keyword.strip().lower()
        # 2020-06-24
        if keyword[-3:-1] == "cd":
            keyword = keyword[:-3]
        keyword = keyword.replace(" ", "-")

        url = f"{cls.site_base_url}/search/{keyword}"
        tree = SiteUtil.get_tree(url, proxy_url=proxy_url, verify=False)

        ret = []
        for node in tree.xpath('//a[@class="movie-box"]')[:10]:
            try:
                item = EntityAVSearch(cls.site_name)
                item.image_url = cls.__fix_url(node.xpath(".//img/@src")[0])

                tag = node.xpath(".//date")
                ui_code = tag[0].text_content().strip()
                try:
                    label, num = ui_code.split("-")  # 4자리 숫자 품번 대응
                    item.ui_code = f"{label}-{num.lstrip('0').zfill(3)}"
                except Exception:
                    item.ui_code = ui_code
                item.code = cls.module_char + cls.site_char + node.attrib["href"].split("/")[-1]
                item.desc = "발매일: " + tag[1].text_content().strip()
                item.year = int(tag[1].text_content().strip()[:4])
                item.title = item.title_ko = node.xpath(".//span/text()")[0].strip()
                if manual:
                    _image_mode = "1" if image_mode != "0" else image_mode
                    item.image_url = SiteUtil.process_image_mode(_image_mode, item.image_url, proxy_url=proxy_url)
                    if do_trans:
                        item.title_ko = "(현재 인터페이스에서는 번역을 제공하지 않습니다) " + item.title
                else:
                    item.title_ko = SiteUtil.trans(item.title, do_trans=do_trans)

                item.score = 100 if keyword.lower() == item.ui_code.lower() else 60 - (len(ret) * 10)
                if item.score < 0:
                    item.socre = 0
                # logger.debug(item)
                ret.append(item.as_dict())
            except Exception:
                logger.exception("개별 검색 결과 처리 중 예외:")
        return sorted(ret, key=lambda k: k["score"], reverse=True)

    @classmethod
    def search(cls, keyword, **kwargs):
        ret = {}
        try:
            data = cls.__search(keyword, **kwargs)
        except Exception as exception:
            logger.exception("검색 결과 처리 중 예외:")
            ret["ret"] = "exception"
            ret["data"] = str(exception)
        else:
            ret["ret"] = "success" if data else "no_match"
            ret["data"] = data
        return ret

    @classmethod
    def __img_urls(cls, tree):
        """collect raw image urls from html page"""

        # poster large
        # 보통 가로 이미지
        pl = tree.xpath('//a[@class="bigImage"]/img/@src')
        pl = pl[0] if pl else ""
        if pl:
            pl = cls.__fix_url(pl)
        else:
            logger.warning("이미지 URL을 얻을 수 없음: poster large")

        # poster small
        # 세로 이미지 / 저화질 썸네일
        ps = ""
        if pl:
            filename = pl.split("/")[-1].replace("_b.", ".")
            ps = cls.__fix_url(f"/pics/thumb/{filename}")

        # fanart
        # 없는 경우도 있음
        # 첫번째 혹은 마지막에 고화질 포스터가 있을 수 있음
        arts = []
        for href in tree.xpath('//*[@id="sample-waterfall"]/a/@href'):
            arts.append(cls.__fix_url(href))

        return {"ps": ps, "pl": pl, "arts": arts}

    @classmethod
    def __info(
        cls,
        code,
        do_trans=True,
        proxy_url=None,
        image_mode="0",
        max_arts=10,
        use_extras=True,
        ps_to_poster=False,
        crop_mode=None,
    ):
        url = f"{cls.site_base_url}/{code[2:]}"
        tree = SiteUtil.get_tree(url, proxy_url=proxy_url)

        entity = EntityMovie(cls.site_name, code)
        entity.country = ["일본"]
        entity.mpaa = "청소년 관람불가"

        #
        # 이미지 관련 시작
        #
        img_urls = cls.__img_urls(tree)
        SiteUtil.resolve_jav_imgs(img_urls, ps_to_poster=ps_to_poster, crop_mode=crop_mode, proxy_url=proxy_url)

        entity.thumb = SiteUtil.process_jav_imgs(image_mode, img_urls, proxy_url=proxy_url)

        entity.fanart = []
        for href in img_urls["arts"][:max_arts]:
            entity.fanart.append(SiteUtil.process_image_mode(image_mode, href, proxy_url=proxy_url))
        #
        # 이미지 관련 끝
        #

        tags = tree.xpath("/html/body/div[5]/div[1]/div[2]/p")
        for tag in tags:
            tmps = tag.text_content().strip().split(":")
            if len(tmps) == 2:
                key = tmps[0].strip()
                value = tmps[1].strip()
            elif len(tmps) == 1:
                value = tmps[0].strip().replace(" ", "").replace("\t", "").replace("\r\n", " ").strip()

            if not value:
                continue

            logger.debug("key:%s value:%s", key, value)
            if key == "識別碼":
                try:
                    label, num = value.split("-")  # 4자리 숫자 품번 대응
                    value = f"{label}-{num.lstrip('0').zfill(3)}"
                except Exception:
                    pass
                entity.title = entity.originaltitle = entity.sorttitle = value.upper()
                if entity.tag is None:
                    entity.tag = []
                entity.tag.append(entity.title.split("-")[0])
            elif key == "發行日期":
                if value != "0000-00-00":
                    entity.premiered = value
                    entity.year = int(value[:4])
                else:
                    entity.premiered = "1999-12-31"
                    entity.year = 1999
            elif key == "長度":
                entity.runtime = int(value.replace("分鐘", ""))
            elif key == "導演":
                entity.director = value
            elif key == "製作商":
                entity.studio = value
                if do_trans:
                    if value in SiteUtil.av_studio:
                        entity.studio = SiteUtil.av_studio[value]
                    else:
                        entity.studio = SiteUtil.trans(value)
                entity.studio = entity.studio.strip()
            # elif key == u'發行商':
            #    entity.studio = value
            elif key == "系列":
                if entity.tag is None:
                    entity.tag = []
                entity.tag.append(SiteUtil.trans(value, do_trans=do_trans))
            elif key == "類別":
                entity.genre = []
                for tmp in value.split(" "):
                    if tmp in SiteUtil.av_genre:
                        entity.genre.append(SiteUtil.av_genre[tmp])
                    elif tmp in SiteUtil.av_genre_ignore_ja:
                        continue
                    else:
                        genre_tmp = SiteUtil.trans(tmp, do_trans=do_trans).replace(" ", "")
                        if genre_tmp not in SiteUtil.av_genre_ignore_ko:
                            entity.genre.append(genre_tmp)
            elif key == "演員":
                if "暫無出演者資訊" in value:
                    continue
                entity.actor = []
                for tmp in value.split(" "):
                    if not tmp.strip():
                        continue
                    entity.actor.append(EntityActor(tmp.strip()))

        tagline = tree.xpath("/html/body/div[5]/h3/text()")[0].lstrip(entity.title).strip()
        entity.tagline = (
            SiteUtil.trans(tagline, do_trans=do_trans).replace(entity.title, "").replace("[배달 전용]", "").strip()
        )
        entity.plot = entity.tagline

        if use_extras or not use_extras:
            entity.extras = []

        try:
            return SiteUtil.shiroutoname_info(entity)
        except Exception:
            logger.exception("shiroutoname.com을 이용해 메타 보정 중 예외:")
            return entity

    @classmethod
    def info(cls, code, **kwargs):
        ret = {}
        try:
            entity = cls.__info(code, **kwargs)
        except Exception as exception:
            logger.exception("메타 정보 처리 중 예외:")
            ret["ret"] = "exception"
            ret["data"] = str(exception)
        else:
            ret["ret"] = "success"
            ret["data"] = entity.as_dict()
        return ret