Comandament iconv a Linux

Comandament Iconv A Linux



Assegureu-vos d'actualitzar la vostra màquina Linux abans d'aprofundir en la implementació d'aquest article. Per a l'actualització, utilitzeu la utilitat 'apt' de Linux amb la paraula clau 'actualitzar' i executeu aquesta instrucció amb els privilegis 'sudo'. Tot i que ara podem passar a la implementació, preferirem actualitzar aquest sistema també, és a dir, una actualització reduiria la possibilitat d'ocurrència d'errors i el sistema seria capaç de resoldre els problemes amb més precisió. Per tant, utilitzeu la utilitat 'apt' dins de la instrucció 'actualització'.

Mirem ara la utilitat iconv de Linux a la seva consola terminal. Per tant, hem estat executant la instrucció “iconv” amb el senyalador “-l” per mostrar tots els jocs de caràcters codificats coneguts i més utilitzats a la pantalla del nostre terminal. Mostrarà els jocs de caràcters codificats juntament amb els seus àlies. Podeu veure una llarga llista de conjunts de caràcters codificats després de desplaçar-vos una mica cap avall.







Ara, és hora de començar amb la implementació de l'ordre iconv a Linux. En primer lloc, necessitem diferents tipus de fitxers al nostre sistema per convertir un tipus de fitxer a un altre tipus. Per tant, estem utilitzant la consulta 'tàctil' al terminal de la consola per crear tres fitxers diferents, és a dir, tipus Java, tipus C i tipus de text. Llistant el contingut actual del directori, hi trobareu els fitxers generats recentment.



Després d'això, veurem el tipus de cada fitxer per separat mitjançant la consulta 'fitxer' juntament amb el nom de cada fitxer. Aquesta consulta necessita l'opció '-I' per mostrar el tipus de conjunt de caràcters de codificació per a cada fitxer per separat. Si us heu oblidat d'utilitzar l'opció '-I', utilitzeu el senyalador '-mime'. Les banderes '-I' i '-mime' funcionen igual.



Ara, després d'executar la instrucció 'fitxer' per al fitxer de tipus 'txt', hem obtingut la codificació del tipus de caràcter 'US-ASCII'. Mentre s'utilitza la mateixa instrucció per als fitxers Java i C, mostra que tots dos fitxers contenen una codificació de tipus de caràcter 'BINARY'. Juntament amb això, aquesta instrucció mostra que tots aquests tres fitxers estan buits.





Ara, il·lustrarem l'ús de la instrucció iconv a la consola per convertir un fitxer de codificació de conjunt de caràcters específic en una altra codificació de conjunt de caràcters. Abans d'això, hem d'afegir algun codi o dades als nostres fitxers. Per tant, hem afegit el codi Java dins del fitxer 'text.java', el codi C dins del fitxer 'text.c' i hem afegit dades de text dins del fitxer 'test.txt'. La consulta cat es va utilitzar aquí per mostrar el contingut dels tres fitxers, tal com es presenta a continuació:



Ara que hem afegit les dades correctament, tornarem a veure la codificació del conjunt de caràcters d'aquests fitxers. Per tant, hem provat la mateixa instrucció de fitxer dins de l'intèrpret d'ordres amb el senyalador '-I' i els noms dels fitxers, és a dir, test.txt, test.java i test.c. L'execució d'aquestes tres instruccions per separat per als tres fitxers mostra que la codificació del conjunt de caràcters s'ha actualitzat per als fitxers Java i C mentre es manté igual per al fitxer de text, és a dir, US-ASCII. La codificació dels fitxers Java i C era anteriorment 'binari'; ara, és 'US-ASCII'. A més, mostra que el fitxer de text conté dades de text sense format mentre que els altres dos fitxers de codi contenen els scripts com a contingut.

És hora de realitzar la tasca real necessària per a aquest article, és a dir, convertir una codificació a una altra utilitzant l'ordre iconv a l'intèrpret d'ordres. Per tant, hem estat utilitzant la instrucció 'iconv' dins del terminal de l'intèrpret d'ordres amb els privilegis 'sudo'. Aquesta ordre pren l'opció '-f' significa 'de' i l'opció '-t' significa 'a', és a dir, d'una codificació a una altra.

Després de l'opció '-f', heu d'especificar la codificació que ja té el vostre fitxer, és a dir, US-ASCII. Mentre que després de l'opció '-t', heu d'especificar la codificació que voleu substituir per la codificació antiga, és a dir, UNICODE. Heu d'especificar el nom d'un fitxer utilitzat com a font amb l'opció –o per crear la seva imatge d'objecte. La imatge de l'objecte seria un altre fitxer, és a dir, 'new.c', del mateix tipus però amb la nova codificació i les mateixes dades.

Després d'executar la següent instrucció, obtindreu un fitxer nou al mateix directori, és a dir, segons la consulta 'ls'. Ara, comprovarem la codificació del conjunt de caràcters d'un fitxer nou generat mitjançant la instrucció iconv. Tornarem a utilitzar la instrucció 'fitxer' amb l'opció '-I' i el nou nom de fitxer, és a dir, new.c.

Veureu que el conjunt de caràcters d'aquest fitxer nou ha estat diferent del conjunt de caràcters d'un fitxer antic, és a dir, el conjunt de caràcters UTF-16LE. Això es deu al fet que hem traduït la codificació US-ASCII a la codificació UNICODE mitjançant la instrucció iconv per al nostre fitxer new.c. La consulta 'gat' mostrava el mateix codi C dins del fitxer, però començava amb alguns caràcters Unicode, tal com ja s'ha presentat.

De manera molt semblant, canviarem la codificació del fitxer de text test.txt. La instrucció del fitxer mostra que té una codificació de conjunt de caràcters US-ASCII. L'ordre iconv s'ha utilitzat amb el mateix format per convertir la codificació del fitxer test.txt d'US-ASCII a TURKISH8. Veureu que no canvia l'US-ASCII al turc.

Després d'això, vam utilitzar la mateixa ordre per cobrir la codificació del conjunt de caràcters US-ASCII a UTF-32 per al mateix fitxer. Aquesta vegada, funciona. Això es deu al fet que de vegades pot haver-hi un problema en convertir un conjunt de codificació en un altre, o és possible que l'altra codificació no ho admeti.

Conclusió

En aquest article es parla de com utilitzar les instruccions de Linux iconv per convertir un conjunt de caràcters de codificació en un altre amb els seus àlies. D'aquesta manera, vam haver de crear alguns fitxers de diferents tipus.