Individuare i valori costituenti i caratteri tipo UTF-8 di lettere localizzate

Da Gambas-it.org - Wikipedia.
Versione del 30 gen 2015 alle 03:31 di Vuott (Discussione | contributi) (Creata pagina con 'Come è noto, ogni carattere ASCII che ha un codice da 0 a 127 occupa un byte, invece set di caratteri come UTF-8 con lettere localizzate del tipo è, é, ù e simili richiedo...')

(diff) ← Versione meno recente | Versione attuale (diff) | Versione più recente → (diff)

Come è noto, ogni carattere ASCII che ha un codice da 0 a 127 occupa un byte, invece set di caratteri come UTF-8 con lettere localizzate del tipo è, é, ù e simili richiedono due o più caratteri.

E' possibile individuare i valori costituenti tali lettere localizzate mediante almeno quattro modalità.


Uso di un Vettore di tipo Byte[]

Questa modalità è molto semplice. Facciamo un esempio con una lettera costituita da due caratteri:

Public Sub Main()  
     
 Dim s As String = "è"  
 Dim bb As Byte[]  
     
' Carichiamo in un Vettore di tipo "Byte[]" tutti i valori che compongono  
' e rappresentano il carattere contenuto nella variabile di tipo "String":
  bb = Byte[].FromString(s)  
          
' Quindi li vediamo nella console:
  Print Hex(bb[0]), Hex(bb[1])  
     
' Procediamo con la controprova:
  Print Chr(bb[0]); Chr(bb[1])  
     
End


Uso di alcune funzioni sulle Stringhe

Anche quest'altra modalità è abbastanza breve:

Public Sub Main()  
 Dim s As String = "è"  
 
  Print Hex(Asc(Mid("è", 1, 1))), Hex(Asc(Mid("è", 2, 1)))  
 
' Procediamo con la controprova:
  Print Chr(Asc(Mid("è", 1, 1))); Chr(Asc(Mid("è", 2, 1)))  
 
End


Uso dei Puntatori e dei Memory Stream

Questa modalità è più complessa e prevede la lettura dell'area di memoria puntata dalla variabile stringa contenente la lettera localizzata:

Public Sub Main()  
 
' Immagazziniamo i valori che compongono la lettera "è" nella memoria 
' mediante il suo assegnamento in una coerente variabile di tipo Stringa:
 Dim s As String = "è"  
 
' Sappiamo che per operare con i "Memory Stream" dobbiamo avere una variabile
' di tipo Puntatore, nella quale leggere (o scrivere) appunto con gli "Stream":
 Dim p As Pointer  
 Dim st As Stream  
 Dim b1, b2 As Byte  
 
' Generiamo una variabile di tipo Puntatore che punta all'indirizzo di memoria della variabile di tipo Stringa contenente il valore "è":
  p = VarPtr(s)  
    
' Generiamo dal Puntatore una variabile di tipo "Stream", con la quale - come già detto -  
' potremo leggere nell'area di memoria puntata dal Puntatore:
  st = Memory p For Read  
 
' Leggiamo il 1° byte dell'area di memoria puntata dal Puntatore e la mostriamo in console:
  Read #st, b1  
  Print Hex(b1),  
 
' Leggiamo il 2° byte dell'area di memoria puntata dal Puntatore e la mostriamo in console:
  Read #st, b2  
  Print Hex(b2)  
 
' Chiudiamo il flusso di memoria:
  st.Close  
 
' Veiamo in console il combinato risultato delle due letture:
  Print Chr(b1); Chr(b2)  
 
End


Usando una funzione di deferenziazione sulla variabile stringa

Mostriamo anche questa quarta modalità, che pur essendo la più breve, restituisce però un risultato da ripulire da alcuni dati che non interessano ai nostri fini, e quindi è da interpretare.

Questa modalità prevede un uso del tutto inusuale della funzione di dereferenziazione Pointer@(), utilizzata solitamente per dereferenziare un Puntatore a Puntatore: nel suo unico argomento verrà posta la variabile Stringa contenente la lettera localizzata.
Ciò nella considerazione che la variabile Stringa punta essa stessa ad un'area di memoria.

 Public Sub Main()

 Dim s As String = "è"

  Print Pointer@(s)

End

Il risultato è costituito dall'indirizzo di memoria della stringa di valori ed alla fine, a destra, dai valori che cerchiamo. In questo caso, come si nota, i valori costituenti la lettera "è" sono posti in un ordine inverso, ossia così: a8c3

Sapendo così interpretare quel risultato, siamo in grado comunque di conoscere i due valori che cercavamo.