از ری تا شهرری؛ واژهها بلند هم میشوند
چرا و چطور بعضی کلمات به طور کامل و طولانی ادا میشوند و برخی خلاصه و کوتاه؟ چرا ری را شهرری میخوانیم اما فئودور داستایفسکی را «داستایفسکی»؟
هم شهود عامیانه و هم پژوهشهای زبانشناختی به ما میگویند که واژههایی که برای گروهی پرکاربرد باشند و شکل طولانیای داشته باشند، به تدریج در گفتار کوتاه میشوند یا با یک گزینه کوتاهتر جایگزین میشوند. به این ترتیب است که در فارسی شابدلظیم جایگزین شاهعبدالعظیم میشود و آقا-خداوند تبدیل به «آخوند» میشود (ریشه داشتن واژه آخوند در خداوند را از سبکشناسی محمدتقی بهار نقل میکنم) و صفت «هستهای» جای گروه اسمی «مساله انرژی هستهای» را میگیرد (مثال: «روحانی توی هستهای خوب عمل کرد»!). و به همین ترتیب است که در انگلیسی برای «باغ وحش» عبارت زولاجکال گاردن تبدیل به زو میشود و در فرانسه به جای سمپاتتیک میگویند سمپا و گاهی به جای فیلوسوفی میگویند فیلو. این کوتاه شدنها در برخی گروههای خاص و بسته اشکال مخصوص آن گروه را هم پیدا میکند. مثل همکلاسیهای سابقم در دانشگاه شریف که حلتمرین را به حلّت و ریاضیات مهندسی را به ریزمو و الکترونیک دیجیتال را به الکدیجیت تبدیل کرده بودند.
هم شهود عامیانه و هم پژوهشهای زبانشناختی به ما میگویند که واژههایی که برای گروهی پرکاربرد باشند و شکل طولانیای داشته باشند، به تدریج در گفتار کوتاه میشوند یا با یک گزینه کوتاهتر جایگزین میشوند.به بیان فنیتر، اتفاقی که میافتد این است که اگر میزان اطلاعات منتقل شده توسط یک کلمه کم باشد (کلمه قابلانتظار/پرکاربرد باشد) گویشور دلش نمیخواهد تعداد واج زیادی خرجش کند. به همین دلیل است که کلمات پرکاربرد/کممحتوایی مثل حروف اضافه (از، به، در،…) معمولا کوتاهند و کلمات هرچه تخصصیتر و کمکاربردتر و در نتیجه منتقل کننده اطلاعات بیشتری هستند (از منظر نظریه اطلاعات) بیشتر ممکن است طولانی باشند (مثل پساساختارگرایی، ریزپردازنده، نظارت استصوابی).
آنچه کمتر به آن توجه میشود این است که به نظر میرسد که این فرآیند در جهت عکس هم عمل میکند. یعنی اگر کلمهای حاوی اطلاعات زیادی باشد (نسبتا کمکاربرد باشد) انگار که گویشوران زبان نمیپسندند که کلمه بیش از حد کوتاه باشد. مثلا کلمه تکهجاییای که فقط دو سه واج دارد معمولا برای واژهای غیر از حروف اضافه و افعال ربطی و مانند اینها چندان مورد پسند نیست. در اسمهای خاص به راحتی میتوان اثر این پدیده را مشاهده کرد که اگر نام خانوادگی کسی کوتاه باشد، تمایل بیشتری به تلفظ اسم کوچکش در کنار نام خانوادگیاش وجود دارد. همه ما با نام خانوادگی درباره تولستوی و داستایوسکی و بالزاک و استاندال حرف میزنیم اما به جای «مان» میگوییم توماس مان و به جای «بُل» میگوییم هاینریش بُل و به جای «ژید» میگوییم آندره ژید. به همین ترتیب، به نظر میرسد که گفتن دیماه و مهرماه به جای دی و مهر بسیار رایجتر باشد تا گفتن خردادماه و اسفندماه به جای خرداد و اسفند. حتی ظن این را دارم که تغییر نام «ری» به شهرری در طول زمان تابع همین فرآیند بوده باشد.
این فرآیند در جهت عکس هم عمل میکند. یعنی اگر کلمهای حاوی اطلاعات زیادی باشد (نسبتا کمکاربرد باشد) انگار که گویشوران زبان نمیپسندند که کلمه بیش از حد کوتاه باشد.نظریه مطرح در این باره این است که گویشور سعی میکند در زمان حرف زدن میزان اطلاعات منتقل شده در واحد زمان ثابت باشد. (باز هم به مقاله سال ۲۰۰۸ Frank و Jaeger اشاره میکنم). هرچه واژه یا مفهوم خارج شده از دهان گوینده پیچیدهتر یا غیرمنتظرهتر یا خاصتر باشد، گویشور سعی میکند بیانش را طولانیتر کند و هرچه پیام پیشپاافتادهتر، یا به عبارت دقیقتر پیشبینیپذیرتر باشد گویشور آن را کوتاهتر میکند. این فرآیند فقط انتخاب کلمات را تغییر نمیدهد بلکه حتی سرعت ادای کلمات را هم تغییر میدهد، و گاهی باعث میشود گوینده استفاده از کلمات اختیاری غیرضروری (مثل «که» در «دیدم که رفته») برای این تنظیم نرخ انتقال اطلاعات استفاده کند.
اما چرا گویشور سعی میکند نرخ انتقال اطلاعات خطی باشد؟ در این باره دو دلیل مطرح شده است. دلیل اول آن است که اگر فرض کنیم نرخ بهینهای برای این کار وجود داشته باشد (با توجه به توان تولید گوینده و توان فهم شنونده) طبیعی است که فرض کنیم گوینده ناخودآگاه سعی میکند همیشه به این نرخ بهینه نزدیک باشد، و در نتیجه نرخ در طول گفتار همگن خواهد بود. دلیل دوم معرفی شده توسط فرانک و یگر، که به نظر من جالبتر و البته پیچیدهتر است (از این جا به بعد متن را اگر حوصله بحث فنی ندارید نخوانید!)، این است که ممکن است میزان دشواری فهم هر پاره گفتار (مثلا هر ثانیه از گفتار) برای شنونده تابعی توانی (و نه خطی) از میزان اطلاعات موجود در آن پاره گفتار باشد. در آن صورت چون مجموع دشواریای که شنونده متحمل میشود حاصلجمع این توانها برای تمام آن پارهگفتارهاست، برای شنونده بهترین حالت این است که میزان اطلاعات بین پارههای گفتار پخش شود تا دشواری کمینه شود. مثلا اگر چهار واحد اطلاعات داشته باشیم و میزان دشواری درک یک پاره گفتار با الف واحد اطلاعات الف به توان دو باشد، و اگر بخواهیم این چهار واحد اطلاعات را بین دو کلمه پخش کنیم، دو راه داریم. راه اول این است که یک کلمه ۳ واحد اطلاعات بگیرد و کلمه دیگر ۱ واحد. در این صورت مجموع دشواری برابر خواهد بود با ۹ (سه به توان دو) به علاوه ۱ (یک به توان دو) یعنی ۱۰. اما اگر به هر کلمه ۲ واحد اطلاعات بدهیم مجموع دشواری برابر خواهد بود با ۴ به علاوه ۴ یعنی ۸. ادعا این است که طی فرآیندهای ناخودآگاهی که هنوز از دقایق چند و چونشان آگاه نیستیم، گفتار در زبان انسانی به نفع شنونده (علاوه بر گوینده) بهینه شده است!