Немного не так, в UTF-8 длина сообщения зависит от используемых символов. В частности, если не залезать за ASCII (для непосвященных - это латиница + знаки препинания и специальные знаки вроде решетки или "собаки"), будет те же 140 символов. Русские буквы вмещаются в 2 символа. Японским требуется до 4-х, причем там же 2 набора иероглифов (хиракана и катакана, кажется так).
Да, в UTF-16 то же, только там 2-байтовыми словами все меряется, т.е. будет не больше, чем 70 символов.
Боюсь сбрехать, но вроде все так.
А что в стандарте GSM - не знаю, но да, в ASCII можно больше вместить, до 140 символов. Может и что-то проприетарное там для локализации.