Lines Matching +full:0 +full:xc2
76 r"&(?!#\d+;|#x[0-9a-fA-F]+;|\w+;)"
83 entity = cls.CHARACTER_TO_HTML_ENTITY.get(matchobj.group(0))
90 entity = cls.CHARACTER_TO_XML_ENTITY[matchobj.group(0)]
310 declared_encoding = declared_encoding_match.groups()[0].decode(
396 sub = '&'.encode() + sub[0].encode() + ';'.encode()
567 b'\xc2' : 'A',
637 0x80 : b'\xe2\x82\xac', # €
638 0x82 : b'\xe2\x80\x9a', # ‚
639 0x83 : b'\xc6\x92', # ƒ
640 0x84 : b'\xe2\x80\x9e', # „
641 0x85 : b'\xe2\x80\xa6', # …
642 0x86 : b'\xe2\x80\xa0', # †
643 0x87 : b'\xe2\x80\xa1', # ‡
644 0x88 : b'\xcb\x86', # ˆ
645 0x89 : b'\xe2\x80\xb0', # ‰
646 0x8a : b'\xc5\xa0', # Š
647 0x8b : b'\xe2\x80\xb9', # ‹
648 0x8c : b'\xc5\x92', # Œ
649 0x8e : b'\xc5\xbd', # Ž
650 0x91 : b'\xe2\x80\x98', # ‘
651 0x92 : b'\xe2\x80\x99', # ’
652 0x93 : b'\xe2\x80\x9c', # “
653 0x94 : b'\xe2\x80\x9d', # ”
654 0x95 : b'\xe2\x80\xa2', # •
655 0x96 : b'\xe2\x80\x93', # –
656 0x97 : b'\xe2\x80\x94', # —
657 0x98 : b'\xcb\x9c', # ˜
658 0x99 : b'\xe2\x84\xa2', # ™
659 0x9a : b'\xc5\xa1', # š
660 0x9b : b'\xe2\x80\xba', # ›
661 0x9c : b'\xc5\x93', # œ
662 0x9e : b'\xc5\xbe', # ž
663 0x9f : b'\xc5\xb8', # Ÿ
664 0xa0 : b'\xc2\xa0', #
665 0xa1 : b'\xc2\xa1', # ¡
666 0xa2 : b'\xc2\xa2', # ¢
667 0xa3 : b'\xc2\xa3', # £
668 0xa4 : b'\xc2\xa4', # ¤
669 0xa5 : b'\xc2\xa5', # ¥
670 0xa6 : b'\xc2\xa6', # ¦
671 0xa7 : b'\xc2\xa7', # §
672 0xa8 : b'\xc2\xa8', # ¨
673 0xa9 : b'\xc2\xa9', # ©
674 0xaa : b'\xc2\xaa', # ª
675 0xab : b'\xc2\xab', # «
676 0xac : b'\xc2\xac', # ¬
677 0xad : b'\xc2\xad', #
678 0xae : b'\xc2\xae', # ®
679 0xaf : b'\xc2\xaf', # ¯
680 0xb0 : b'\xc2\xb0', # °
681 0xb1 : b'\xc2\xb1', # ±
682 0xb2 : b'\xc2\xb2', # ²
683 0xb3 : b'\xc2\xb3', # ³
684 0xb4 : b'\xc2\xb4', # ´
685 0xb5 : b'\xc2\xb5', # µ
686 0xb6 : b'\xc2\xb6', # ¶
687 0xb7 : b'\xc2\xb7', # ·
688 0xb8 : b'\xc2\xb8', # ¸
689 0xb9 : b'\xc2\xb9', # ¹
690 0xba : b'\xc2\xba', # º
691 0xbb : b'\xc2\xbb', # »
692 0xbc : b'\xc2\xbc', # ¼
693 0xbd : b'\xc2\xbd', # ½
694 0xbe : b'\xc2\xbe', # ¾
695 0xbf : b'\xc2\xbf', # ¿
696 0xc0 : b'\xc3\x80', # À
697 0xc1 : b'\xc3\x81', # Á
698 0xc2 : b'\xc3\x82', # Â
699 0xc3 : b'\xc3\x83', # Ã
700 0xc4 : b'\xc3\x84', # Ä
701 0xc5 : b'\xc3\x85', # Å
702 0xc6 : b'\xc3\x86', # Æ
703 0xc7 : b'\xc3\x87', # Ç
704 0xc8 : b'\xc3\x88', # È
705 0xc9 : b'\xc3\x89', # É
706 0xca : b'\xc3\x8a', # Ê
707 0xcb : b'\xc3\x8b', # Ë
708 0xcc : b'\xc3\x8c', # Ì
709 0xcd : b'\xc3\x8d', # Í
710 0xce : b'\xc3\x8e', # Î
711 0xcf : b'\xc3\x8f', # Ï
712 0xd0 : b'\xc3\x90', # Ð
713 0xd1 : b'\xc3\x91', # Ñ
714 0xd2 : b'\xc3\x92', # Ò
715 0xd3 : b'\xc3\x93', # Ó
716 0xd4 : b'\xc3\x94', # Ô
717 0xd5 : b'\xc3\x95', # Õ
718 0xd6 : b'\xc3\x96', # Ö
719 0xd7 : b'\xc3\x97', # ×
720 0xd8 : b'\xc3\x98', # Ø
721 0xd9 : b'\xc3\x99', # Ù
722 0xda : b'\xc3\x9a', # Ú
723 0xdb : b'\xc3\x9b', # Û
724 0xdc : b'\xc3\x9c', # Ü
725 0xdd : b'\xc3\x9d', # Ý
726 0xde : b'\xc3\x9e', # Þ
727 0xdf : b'\xc3\x9f', # ß
728 0xe0 : b'\xc3\xa0', # à
729 0xe1 : b'\xa1', # á
730 0xe2 : b'\xc3\xa2', # â
731 0xe3 : b'\xc3\xa3', # ã
732 0xe4 : b'\xc3\xa4', # ä
733 0xe5 : b'\xc3\xa5', # å
734 0xe6 : b'\xc3\xa6', # æ
735 0xe7 : b'\xc3\xa7', # ç
736 0xe8 : b'\xc3\xa8', # è
737 0xe9 : b'\xc3\xa9', # é
738 0xea : b'\xc3\xaa', # ê
739 0xeb : b'\xc3\xab', # ë
740 0xec : b'\xc3\xac', # ì
741 0xed : b'\xc3\xad', # í
742 0xee : b'\xc3\xae', # î
743 0xef : b'\xc3\xaf', # ï
744 0xf0 : b'\xc3\xb0', # ð
745 0xf1 : b'\xc3\xb1', # ñ
746 0xf2 : b'\xc3\xb2', # ò
747 0xf3 : b'\xc3\xb3', # ó
748 0xf4 : b'\xc3\xb4', # ô
749 0xf5 : b'\xc3\xb5', # õ
750 0xf6 : b'\xc3\xb6', # ö
751 0xf7 : b'\xc3\xb7', # ÷
752 0xf8 : b'\xc3\xb8', # ø
753 0xf9 : b'\xc3\xb9', # ù
754 0xfa : b'\xc3\xba', # ú
755 0xfb : b'\xc3\xbb', # û
756 0xfc : b'\xc3\xbc', # ü
757 0xfd : b'\xc3\xbd', # ý
758 0xfe : b'\xc3\xbe', # þ
762 (0xc2, 0xdf, 2), # 2-byte characters start with a byte C2-DF
763 (0xe0, 0xef, 3), # 3-byte characters start with E0-EF
764 (0xf0, 0xf4, 4), # 4-byte characters start with F0-F4
767 FIRST_MULTIBYTE_MARKER = MULTIBYTE_MARKERS_AND_SIZES[0][0]
797 chunk_start = 0
798 pos = 0
812 elif byte >= 0x80 and byte in cls.WINDOWS_1252_TO_UTF8:
825 if chunk_start == 0: