Unicode :: Map8.

Unicode :: Map8 è una tabella di mappatura tra caratteri a 8 bit e unicode.
Scarica ora

Unicode :: Map8. Classifica e riepilogo

Annuncio pubblicitario

  • Rating:
  • Licenza:
  • Perl Artistic License
  • Prezzo:
  • FREE
  • Nome editore:
  • Gisle Aas
  • Sito web dell'editore:
  • http://search.cpan.org/~gaas/

Unicode :: Map8. Tag


Unicode :: Map8. Descrizione

Unicode :: Map8 è una tabella di mappatura tra caratteri a 8 bit e unicode. Unicode :: Map8 è una tabella di mappatura tra caratteri a 8 bit e unicode.synopsis richiede unicode :: Map8; My $ No_Map = Unicode :: Map8-> Nuovo ("ISO646-No") || morire; My $ L1_Map = Unicode :: Map8-> Nuovo ("Latin1") || morire; My $ USTR = $ no_Map-> a16 ("V} Re Norske TEGN B | R {Resn"); My $ LSTR = $ l1_map-> a8 ($ ustr); Stampa $ lstr; Stampa $ No_Map-> TOU ("V} RO NORSKE TEGN B | R {RESNEN") -> UTF8TH Unicode :: Map8 Classe Implementare tabelle di mappatura efficienti tra set di caratteri a 8 bit e set di caratteri a 16 bit come Unicode. Le tabelle sono efficienti sia in termini di spazio assegnato che velocità di traduzione. Si presume che le stringhe a 16 bit utilizzano l'ordine di byte di rete. Sono disponibili i seguenti metodi: $ m = Unicode :: Map8-> Nuovo () Il costruttore dell'oggetto crea nuove istanze della classe MAP8. Preso un argomento opzionale che specifica quindi il nome di un set di caratteri a 8 bit per inizializzare i mapping da. L'argomento può anche essere un nome di un file di mappatura. Se il charset / file non può essere posizionato, il costruttore restituisce undef.it omettono l'argomento, quindi viene costruita una tabella di mappatura vuota. È quindi necessario aggiungere le coppie di mappatura ad essa utilizzando il metodo AddPair () descritto di seguito. $ M-> AddPAIR ($ U8, $ U16); aggiunge una nuova mappatura Accoppiamento all'oggetto di mappatura. Ci vogliono due argomenti. Il primo è il valore del codice nel set di caratteri a 8 bit e il secondo è il valore del codice corrispondente nel set di caratteri a 16 bit. Gli stessi codici possono essere utilizzati più volte (ma usare la stessa coppia non ha alcun effetto). La prima definizione per un codice è quella che viene utilizzata. Sostenire il seguente esempio: $ M-> AddPAIR (0x20, 0x0020); $ M-> AddPAIR (0x20, 0x00A0); $ M-> AddPAIR (0xA0, 0x00A0); Significa che il personaggio 0x20 e 0xa0 nelle mappe dei caratteri a 8 bit a se stessi nel set a 16 bit, ma nel set di caratteri a 16 bit 0x0a0 Maps a 0x20. $ m -> Default_to8 ($ U8) Impostare il codice del carattere predefinito da utilizzare durante la mappatura da corde a 16 bit a 8 bit. Se non è presente alcuna coppia di mappatura definita per un carattere, questa predefinita è sostituita da TO8 () e Recode8 (). $ M-> default_to16 ($ U16) Impostare il codice del carattere predefinito da utilizzare quando si mappa da 8 bit a 16 --bit stringhe. Se non è presente alcuna coppia di mappatura definita per un personaggio, questo predefinito è utilizzato da TO16 (), ToU () e Recode8 (). $ M-> nostrict; tutte le mappature indefinite vengono sostituite con la mappatura dell'identità. Il carattere non definito è normalmente appena rimosso (o sostituito con il valore predefinito se definito) durante la conversione tra set di caratteri. $ M-> a8 ($ ustr); converte una stringa di caratteri a 16 bit nella stringa corrispondente nel set di caratteri a 8 bit. $ M-> TO16 ($ str); converte una stringa di caratteri a 8 bit nella stringa corrispondente nel set di caratteri a 16 bit. $ M-> tou ($ str); lo stesso Oggetto stringa anziché una stringa UCS2 semplice. $ M-> Recode8 ($ M2, $ STR); mappare la stringa $ STR da un set di caratteri a 8 bit ($ m) a un altro ($ m2). Poiché supponiamo di sapere che i mappature verso la codifica comune a 16 bit possiamo usare questo per convertire tra uno qualsiasi dei set di caratteri a 8 bit. $ M-> to_char16 ($ U8) mappa un singolo codice di carattere a 8 bit su un 16 --bit. Se il carattere a 8 bit è non mappato, viene restituito il costante Noil. L'impostazione predefinita non viene utilizzata e il metodo di richiamata non viene invocato. $ M-> to_char8 ($ U16) mappa un singolo codice carattere a 16 bit su un codice a 8 bit. Se il carattere a 16 bit è non mappato, viene restituito il costante nochare. L'impostazione predefinita non viene utilizzata e il metodo di richiamata non è invocato. I seguenti metodi di callback sono disponibili. È possibile ignorare questi metodi creando una sottoclasse di Unicode :: Mappa8. $ M-> UNMAPED_TO8Quando la mappatura alla stringa di caratteri a 8 bit e non vi è alcuna mappatura definita (e nessun valore predefinito), questo metodo è chiamato come l'ultima risorsa. È chiamato con un singolo argomento intero che è il codice del carattere a 16 bit non mappato. Si prevede di restituire una stringa che sarà incorporata nella stringa a 8 bit. La versione predefinita di questo metodo restituisce sempre una stringa vuota. Esempio: pacchetto mymapper; @ ISA = QW (Unicode :: Map8); sub non mappato_to8 {my ($ sé, $ codice) = @_; Richiedere Unicode :: Charname; ""; } $ M-> UNMAPED_TO16Lewise durante la mappatura alla stringa di caratteri a 16 bit e nessuna mappatura viene definita, questo metodo è chiamato. Dovrebbe restituire una stringa a 16 bit con i byte nell'ordine del byte di rete. La versione predefinita di questo metodo restituisce sempre una stringa vuota. Requisiti: · Perl.


Unicode :: Map8. Software correlato