コラム

画面がぐちゃぐちゃ?

エクセルではちゃんと表示されていたのに、データを取り込んだら文字がぐちゃぐちゃってことありませんか?

それ、文字コードのせいです

と言われても「文字コード」って何?と思いますよね。

いま視覚情報として見ている文字ですが、パソコンの中ではコード(数字体系)として管理されています。半角の【A】は【65】のように。アルファベット、数値、半角記号までならどの国でも共通なので問題ないのですが、各国の言語となると話は異なります。

日本だけ通じる文字コード体系

歴史なんて書いても読者のみなさんにとって意味はないので、思い切って割愛します。

日本だけで通じる文字コードにはメールでよく使われている【ISO-2022-JP】、マイクロソフト オフィス標準の【Shift-JIS】などがあります。ざっくりと「そんなものがあるんだぁ」くらいで大丈夫です。

時代はグローバル、日本だけで通じてもだめだよね。ってことで世界標準の文字コード体系があります。

世界でも通じる文字コード体系

それがUnicode、UTF-8、UTF16と呼ばれるものです。こちらも詳細は割愛しますが、インターネットの世界ではUTF-8が多く利用されています。

それでも世界の国の文字がすべて表現できるわけではありません。足りない文字があったり、表現に工夫を凝らさないといけなかったり…これはまた別のお話ですね。

どうして文字化けが起こるの?

先ほどコードで文字を管理していると書きました。

半角の領域は共通のコードが割り当てられていますが、各国の独自表現(日本語もそのうちのひとつ)になるとコート体系ごとに割付がことなります。

「春」をコードで表現するとShift-JISは【8f74】ですが、UTF-8は【E698A5】です。つまり「春」はShift-JISでは【8f74】と表現されているのでUTF-8として読むと全然違う文字になってしまうわけです。これが文字化けの原因です。

どんな時に文字化けが起こるのか

皆さんが遭遇するシーン、それはデータ移動のときですね。CSV形式でデータをダウンロード、別のシステムへ入力するときに「なんだこりゃ!」になるのかもしれません。

または、ダウンロードしたCSVデータをエクセルで開こうとしたら文字化けだらけでまったく読めないとかでしょう。

対処はどうすればいい?

「文字コード変換すればいいよ」って一言で済ませられればいいのですが、そうもいかないですよね。

そんなときはGoogleスプレッドシートで該当ファイルを開きましょう。文字コードを自動認識して閲覧可能になります。

ABOUT ME
Nozomu.Kon
トータルソフトウェアコーディネーターがあなたのお困りを即時に解決!