變量值是指某一變量的具體取值。獲取變量值,大抵有兩大類方法:一是借用已有數據,二是自己測量。例如,參加社會保障的人數可以是604.1萬人、679.5萬人等,這些數字就是變量值。不同的變量的變量值的特點各不相同,確定性變量的變量值有明確的變化方向;隨機變量的變量值則有一定的隨機性。
中文名變量值
外文名variate-value
適用領域數值、字符
所屬學科統計學
定義變量的具體表現,就是可變數量標志或統計指標的不同取值,稱為變量值(即標志值)。一個變量可以取多個變量值,二者不能混淆。例如,工資這個變量,可具體表現為2840元、3780元、4900元、5680元等多個變量值。[1]
性質取值范圍變量的取值既可以是數值,也可以是表達屬性的字符。成年人年齡這個變量,既可以用“老、中、青”來作為變量值,也可以用具體的年齡來取值。性別則只能取男或女,既沒有第三個選擇,也不能用數值來取代,除非事先約定用“0”表示男,以“1”表示女。在利用一些統計軟件(如SPSS)對變量進行編碼時,這也是一種常見的策略。
顧名思義,變量的含義即在于其取值的不確定性,也即變量值一般是處在某個范圍之間的,這個范圍在統計上稱為全距(Range)。在一項具體的研究實踐中,必須弄清楚變量取值的變異范圍,并采取適當的策略來加以處理。
在社會科學研究中,很多變量值自身所具有的敏感性、隱秘性、含混性和抽象性特點,使得研究者難以了解變量的全貌,即變量的變異范圍。例如,在關于“城市居民社會地位與旅游消費行為的關系”研究課題中,必然會涉及“居民收入”這個變量。然而,這是一個很敏感、隱秘的變量,幾乎不可能確切知道城市居民的實際收入的上下限到底是多少。高收人家庭可能日入斗金、年收人數以億汁,低收入者也可能人不敷出。好在我們的研究更關注“大眾旅游”的情況,因此,對于極端的收入水平可以不予考慮。在這種情況下,家庭月收人在1000~50000元范圍內的城市居民,應該占據我們研究課題分析單位的絕大部分。
當要測量的變量是接近于同情心、偏見、愉悅、態度之類的抽象概念時,變量的取值問題更需要加以注意,以免出現偏于一端、失之武斷的缺欠。比如,你如果是在2001年前后調查安徽世界文化遺產地宏村村民對旅游開發的態度,可以讓村民就你所列舉的關于這個“態度”變量表達“非常贊同”或“不感興趣”兩個選項中的一個,以此作為判斷民意的依據。那么,你很可能由于這種“變量值”范圍限定的不合理性,使得你并沒有取得全部的態度類型。因為,在那一段時期,宏村村民不僅不是不感興趣的問題,而且還可能強烈反對山。合適的取值范圍應該從非常贊同到沒有意見,直至非常反對。
有些變量的取值范圍是固定的(如性別),也有一些變量的取值范圍雖然不能準確限定,但卻可以預估其范圍(如身高、年齡、收入、職業、受教育程度、家庭人口數等),還有一些變量的取值范圍根本無法事先預計(如游覽時間、休閑偏好、購物支出和閱讀興趣等),甚至有一些變量的取值具有無限的可能性(如某一平方千米范圍每一點的地下水位,由于“點”的無限可能性,因此相應的地下水位也會有無限個數值)。
分組很多情況下,需要對取值范圍差異很大的變量進行分組。如果所劃分的組別由單一數值或字符來表示,此種分組為單項式分組。將性別分為男性和女性兩個組,將某旅游地的家庭旅館按照擁有客房間數分成5、10、12、15、27四個組,都屬于單項式分組。這種分組方式適合于變量為離散變量且變量值變異范圍很小的情況。否則,就需要采用組距式分組。
組距式分組的組數多少與全距(R=最大變量值一最小變量值)的大小和設定組距的寬窄有關。在變量值的全距一定的前提下,組數越多,組距自然越窄。而這種分組策略的結果是保留了較多的資料細節,卻以損失變量數列的概括性為代價。相反,組數越少,組距就會越寬,變量數列越概要,損失的原始信息也越多。在確定組數與組距時,就需要在這兩種情況中進行權衡。
一般地,組數的多少會與原始數據的多少有些關系。原始數據很多時,可以多分幾組,相反,就可以少分幾組。需要提醒的是,過少的分組決策有可能使原始資料的分布模式徹底被抽象掉,從而使分組失去意義。
通常,當組數確定時,可以根據組距=全距/組數的公式計算組距的大致寬度;或者相反,當已經決定要用多寬的組距時,也可以反過來求可以劃分的組數。
當采用不等組距分組時,上述公式就不適用了。不等組距用于變量值的分布極不均衡的場合。當試圖描述總體分布的實際模式時,不等組距常常會掩飾這種模式,因此要特別注意。下文提到的“開口組”也是不等組距的一種形式。
方法變量值1、借用已有數據
例如,各類年鑒上的數據。如,中國統計年鑒、中國城市統計年鑒、中國金融統計年鑒、中國建筑業統計年鑒、省統計年鑒。如果不清楚有哪些年鑒,可以先查看《中國年鑒概覽》,然后查找有關年鑒。該概覽還提供了被檢索的次數情況,可供引用者參考。
使用年鑒中的數據,要注意不同年鑒中的數據可能不一致的問題。出許多人的意料,同一個變量在不同年鑒中的數據常常是不一致的。形成差異的主要原因是變量的內涵的差異。所以,在使用年鑒數據前,一定要仔細閱讀年鑒的說明,弄清楚變量的定義。
已有數據,也包括他人文獻中的數據。引自他人文獻中的數據,要注意作者的嚴肅性與權威性,不可“以訛傳訛”。
2、自己測量
自己測量變量值,是包括管理科學在內的社會科學研究的最重要的基本能力之一。沒有這個能力,一般很難進入創造性的研究,特別是有獨創性的研究。
僅僅依靠年鑒上的數據和別人的數據,采用別人沒有想到的處理數據的方法,研究出與眾不同的結果是很難的。
特點不同的變量的變量值的特點各不相同:離散變量的變量值可一一列舉;連續變量的變量值則不能一一列舉,只能用區間表示;確定性變量的變量值有明確的變化方向;隨機變量的變量值則有一定的隨機性。
關系變異是統計研究的前提條件,變量和變量值是在變異的前提下表現為可變的數量標志和數量標志值。所以說,變量和變量值都存在于變異之中,它們的關系是互相依存的。
變異標志在同一總體不同個體之間的差別是變異。變異的普遍存在是統計核算的前提條件.
標志按個體表現不同,分為不變標志、變異標志,同一總體中的每個個體都具有不變標志和變異標志。
標志按性質不同,分為品質標志和數量標志,變異標志也分為品質變異標志和數量變異標志。如,性別與年齡。
把總體、個體和標志三個概念聯系起來,總體的特征概況為:
(1)同質性
(2)大量性
(3)差異性
變量變量:數量變異標志。
變量值:數量變異標志的表現形式的具體的數值。
變量又分為連續變量、離散變量
連續變量,如,年齡,身高,體重等,兩個變量值之間有無數的分割。
離散變量,如,職工人數,企業個數等。變量值只能取整數。
參考資料本文發布于:2023-06-04 21:00:22,感謝您對本站的認可!
本文鏈接:http://www.newhan.cn/zhishi/a/92/200106.html
版權聲明:本站內容均來自互聯網,僅供演示用,請勿用于商業和其他非法用途。如果侵犯了您的權益請與我們聯系,我們將在24小時內刪除。
本文word下載地址:變量值(統計學術語).doc
本文 PDF 下載地址:變量值(統計學術語).pdf
| 留言與評論(共有 0 條評論) |