Boards
먼저, 저는 통계학 전공자가 아니며,
제 전공 분야에서 논문을 쓰기 위해 필요한 수준의 지식을 겨우 습득해나가고 있는 단계에 있음을 밝힙니다.
혹시 제 게시물에 논리적인 오류나 분석 기법 선택의 오류가 있다면 수정해주시면 감사하겠습니다.
아울러 이 글을 작성한 이유는 오로지 호기심 때문이며,
김진우님은 물론 토론에 참여하신 특정 회원님을 지지 혹은 반박 하기위해 작성한 것이 아님을 밝힙니다.
김진우님께서 공개하신 데이터 (http://www.testdrive.or.kr/?mid=boards&document_srl=969480)에 대하여
independent t-test를 시행하여 "일반유/고급유 주유 시 연비에 통계적으로 유의미한 차이가 있는가"를 검증하였습니다.
일반유 (Group 1)와 고급유 (Group 2)의 연비 (MPG)의 평균과 표준편차입니다.
집단통계량 | ||||||
Group | N | 평균 | 표준편차 | 평균의 표준오차 | ||
MPG | dimension1 | 1 | 20 | 16.985 | 2.2070 | .4935 |
2 | 16 | 17.669 | 1.3651 | .3413 |
이에 대하여 유의 수준을 일반적인 수준인 0.05로 설정하고 independent t-test를 시행하였습니다.
독립표본 검정 | ||||||||||
Levene의 등분산 검정 | 평균의 동일성에 대한 t-검정 | |||||||||
F | 유의확률 | t | 자유도 | 유의확률 (양쪽) | 평균차 | 차이의 표준오차 | 차이의 95% 신뢰구간 | |||
하한 | 상한 | |||||||||
MPG | 등분산이 가정됨 | 2.478 | .125 | -1.083 | 34 | .286 | -.6837 | .6314 | -1.9670 | .5995 |
등분산이 가정되지 않음 | -1.140 | 32.193 | .263 | -.6837 | .6000 | -1.9057 | .5382 |
등분산 검정 결과 p>.05이므로 등분산을 가정할 수 없습니다.
따라서 p=.263으로, 유의 수준 0.05보다 크므로,
두 그룹의 연비에 통계적으로 유의미한 차이가 없다는 것이 본 분석의 결론입니다.
이것이 '두 그룹이 같다'는 것을 의미하지는 않습니다.
"'두 그룹이 통계적으로 다르다'고 결론 내리기에는 근거가 충분하지 않다." 정도로 이해하시면 되겠습니다.
본 분석이 보다 큰 검정력을 가지기 위해서는
n을 늘리거나 (반복 측정을 통해 충분한 data 확보),
근본적으로는 표준편차를 줄이는 (통제 가능한 변인들을 모두 고정하고 유종만 변경하여 실험) 방법이 있겠습니다.
한편, 리플에서 이어진 토론에서 언급된 연비에 영향을 줄 수 있는 요소로는
"엔진 마모 (길들이기), 엔진 오일 교체, 대기 온도, 습도, 타이어 공기압 및 마모도, 주행 패턴 (승차 인원, 화물 적재량 등을 포함)" 등이 있었습니다.
이 변인들 가운데, "습도, 타이어 공기압, 주행 패턴"은 측정 회수(n)이 적지 않고 누적 주행거리가 크므로 adjustment가 필요 없다고 상정할 수 있겠으나,
"엔진 마모, 엔진 오일 교체, 대기 온도 (계절 변화로 인한), 타이어 마모도"로 인한 연비의 변화는 본 데이터에 비뚤림(bias)으로 작용하고 있다고 봅니다.
연비외에 일반유 세팅 차량에 고급유를 넣었을 때의 부수적인 이익에 대하여 생각해보자면 노킹 예방 밖에는 없지 않을까 싶습니다.
1) 세정제 등의 케미컬은 일반유에도 함유되어 있습니다. 케미컬의 구성 성분이라는 측면에서 고급유와 차이가 있는지 여부는 모르겠습니다.
2) 황 등의 환경오염 유발물질 함량의 차이에 대해서는 해당 분야 전문가의 고견을 청하고 싶습니다.
제가 알기로, 고급휘발유와 일반휘발유의 차이로 "대중에게 알려진" 것은 서로 다른 옥탄가밖에 없습니다.
이상의 분석을 바탕으로 제 나름의 결론을 내려보면 아래와 같습니다.
1) 일반유 및 고급유 주유 시 약간의 연비 차이가 관찰되는 듯 하나, 통계적으로 유의한 정도의 차이는 아니다.
2) 노킹 예방 등의 목적으로 주유하는 것은 의미 있을 것으로 생각된다.
첨언> 제가 통계적 유의성에 대해 이해한답시고 고생을 많이 했던지라
이 분석 결과를 어떻게 설명해야할지 고민이 많습니다.
김진우님께서 올려주신 데이터에 근거할 때,
"해당 차량에 고급유를 주유하였더니 연비가 향상되었다."는 것은 분명한 사실입니다.
다만 그 데이터로부터 "고급유를 주유하면 연비가 향상된다"는 일반론을 이끌어내기에는 근거가 부족하다는 것이 제 글의 결론이니
혹시나마 제 의도를 오해하지 않아주셨으면 합니다.
와우 일목요연하게 정리잘된 글입니다. 무식해서 몬소린지는 잘모르겠지만서도 ㅎㅎ
보통연비관련된 글들은 신뢰가 잘안가네요
그나저나 마크리 그차 하자아닌가요? 고급유를써야 노킹이 안날정도라면요 성능이 더 좋아지는 것도 아니고
단순히 노킹땜시 고급유 써야하는걸로 이해되서요 고성능엔진이라면 이해라도 하겠는데 그것두 아니고
위의 데이터는 잘 모르겠구요. 제가 느낀점을 쓴겁니다. 뭐 어떻게 보면 주관적이라고 볼수도 있죠.
일반유와 고급유 차이가 가장 많이 나는건 한여름 고부하주행시입니다. 영동고속도로 원주->둔내 구간 긴 오르막에서 5단기어 넣고 엑셀레이터 페달 끝까지 밟을때 가장 차이 많이 나리라 생각합니다.
혹시 마크리 수동 155/70/14 가지고 계신분들중에 튜닝안한 분 계신다면 한여름에 한번 일반유와 고급유 비교벙개 쳐보고 싶습니다.
지난주 수요일에 엔진오일 0w20에 습윤식 필터로 교체했습니다.(연비올리기 위한 마지막 발악이라고 생각하시면 됩니다)

수학 일체를 싫어해서 통계도 영 흥미가 없었는데, 관심을 가져보게 될 계기가 되는 글입니다. 좋은 글 잘 읽었습니다 ^^

관련 글 중 가장 후련하게 읽었습니다. 종결자 인정입니다.^^ 배선재님의 글중"
김진우님께서 올려주신 데이터에 근거할 때,
"해당 차량에 고급유를 주유하였더니 연비가 향상되었다."는 것은 분명한 사실입니다.
다만 그 데이터로부터 "고급유를 주유하면 연비가 향상된다"는 일반론을 이끌어내기에는 근거가 부족하다는 것이 제 글의 결론이니..."
이 것이 김진우님의 글에 혹시라도 반박하는 듯한 글을 올리신 회원님들의 공통적인 생각이 아니었나 합니다. 김진우님의 글을 읽어보면, 고급유를 주유하면 연비가 향상된다 라는 결론을 내리시는 듯 저도 느꼈습니다. 사실 그 김진우님의 말씀이 틀렸다라고 볼수는 전혀 없구요. 다만 그 근거로 드신 주유기록표가 김진우님의 말씀을 뒷받침할 만한 근거가 되지 못한다 라는 것이 아마 리플을 다신 회원님들의 공통적인 의견이 아니었을까 하네요. 저도, 김진우님의 글의 내용도 모두 믿고, 내리신 결론도 충분히 동의합니다만, 그에대한 근거를 드신 기록표에 대해서는 배선재님의 의견처럼 생각이 들어서요.^^
제가 쪽지를 하나 받았는데 시스템 오류로 제목도 내용도 확인하지 못하고 삭제되었습니다.
아마 이 글 관련이 아닐까 싶어서 여기 남깁니다. 쪽지 주신 회원님께서는 다시 한번 발송해주시면 감사하겠습니다.

고등학교 다닐때 통계는 스킵하고 수능을 봐서 뭔말씀인지 하나도 모르겠군요^^ 정말 테드엔 박학다식한 분들이 많다는 생각이 듭니다. 종결자 공감합니다.
통계는 거짓말이라고 이야기 하는 사람들도 많죠.^^
특히 p밸류 값으로 나누는 걸...
정성 가득한 글입니다.
오랜만에.. 통계에 관계된 글 보니.. 논문 쓸 때 생각나네요.^^
일반유는 여름을 포함해서 연비가 좋은 계절임에도 연비가 나빴고, 고급유는 겨울을 포함하여 연비가 나쁜 계절임에도 연비가 좋았으므로, 분석은 같은 계절에서 고급유와 일반유를 번갈아가며 기록한 후 이루어져야 실질적인 차이를 알 수 있을 것 같습니다.

본 연비 측정에는 연료외에도 다른 환경 요건이 있으니...^^
결과를 가지고 분석한 통계 관련 지표들은 그렇게 나올수도 있겠지요.
차종에 따라서 고급유가 좀 더 연비가 좋게 나오는 경우가 꽤 있더군요.
보통... 같은 비용으로 같은 주행거리를 달성한다고 하시는 분들이 좀 계십니다.^^
물론 저도 그랬었구요~~
고급유 나름 만족하면서 탔습니다.^^
그나저나 오랜만에... 통계를 보니... 뭐..그런게 있었나 싶기도 하고...^^

김진우님이 올린 글이 게시판에 화제가 되었군요 ^^; 일반유와 고급유의 가장 큰 차이는 아무래도 performance가 아닐까 싶습니다. 일전에 미국에서 발간되는 'European Car'라는 잡지에 2.5L 5기통 엔진을 장착한 제타를 가지고 일반유, 고급유 실험을 진행했던 기사를 읽은 적이 있습니다. 성능 측정 표를 유심히 살펴보면 분명 차이가 있기는 있더군요.(0-60mile, 1/4mile, 등의 지표) 참고로 5기통 제타는 고급유를 추천하지 않는 차량이었습니다. 아마 다른 차량들도 마찬가지가 아닐까 싶습니다. 고급유를 사용하지 않아도 되는 차량일지라도... 고급유를 사용하면 미세하나마 성능이 좋아지는 점은 부인하기 어렵지 않을까 싶네요. 참고로 그 기사의 결론이 'what you pay is what you get'였습니다. ㅎㅎ

죄송합니다만... ^^ 통계에 대해 말씀드릴게 있어서요....
제가 알고있기로는,
등분산 검정의 귀무가설은 '두 그룹의 분산에는 차이가 없다'이기 때문에, p-value가 유의수준보다 크다는
뜻은 귀무가설을 기각할 수 없다는 뜻이 됩니다. 그러므로 두 그룹의 분산은 차이가 없다고 해석해야
하는 것입니다. 즉, t-test의 값은 0.286이 됩니다. (윗줄의 data를 읽어야 합니다. )
뭐 결론은 똑같지만요. ^^
그런데, 저는 이 data로 t-test를 하는 것은 적합하지 않다고 생각됩니다.
왜냐면 일정기간동안에 같은 차량에 지속적으로 일반유를 주유 했던 기록과, 고급유를 주유했던 기록이기 때문에,
실제로는 일반유 주유기간 동안의 총 주행거리와 총 주유량으로 전체연비 얼마, 마찬가지로 고급유 전체 연비
얼마 이렇게 단순한 자료라고 생각됩니다.
만약, 같은 기간동안, 같은 량의 연료로 같은 주행거리를 달렸으면서도 주유를 자주자주 함으로써 연비기록을 자주 한다면,
측정값의 수, 즉 n수가 더 늘어납니다.
즉, 실제로는 같은기간동안 같은 주행거리를 달렸어도 주유횟수에 따라 통계값이 달라질 수 있습니다.
그러므로 그냥 전체를 하나의 값으로 읽는 것이 더 옳다고 봅니다.
아니면, 각각의 연비계산값에서 주행거리만큼의 가중치를 주어서 통계적 검정을 하는 것도 생각할 수 있겠습니다.
하여... 위의 data는 일단 차이가 있는 것같으니 추가연구가 필요하지 않을까 하는 정도의 의미로 해석하는 것이
더 좋겠다는 생각입니다. ^^ (이미 말씀해주신 대로요.)
종결자 인정입니다. -_-b