簡體   English   中英

SIGSEGV,(貌似)由printf引起

[英]SIGSEGV, (seemingly) caused by printf

首先,對任何交叉發布道歉。 希望我不是在這里重復一個問題,但我無法在其他地方找到這個問題(通過Google和Stack Overflow)。

這是錯誤的要點。 如果我在代碼中的任何地方調用printfsprintffprintf來顯示浮點數,我會收到SIGSEGV (EXC_BAD_ACCESS)錯誤。 讓我舉個例子。

以下引發錯誤:

float f = 0.5f;
printf("%f\n",f);

此代碼不會:

float f = 0.5f;
printf("%d\n",f);

我意識到那里存在隱含的轉換,但我並不關心這一點。 我只是無法理解為什么打印浮點數而不是打印整數會引發錯誤。

注意:部分代碼使用malloc創建一些非常大的多維數組。 但是,這些打印語句沒有以任何方式引用這些數組。 這是我如何聲明這些數組的示例。

#define X_LEN 20
#define XDOT_LEN 20
#define THETA_LEN 20
#define THETADOT_LEN 20
#define NUM_STATES (X_LEN+1) * (XDOT_LEN+1) * (THETA_LEN+1) * (THETADOT_LEN+1)
#define NUM_ACTS 100

float *states = (float *)malloc(NUM_STATES * sizeof(float));
// as opposed to float states[NUM_STATES] (more memory effecient)


float **q = (float**)malloc(NUM_STATES * sizeof(float*));

for(int i=0; i < NUM_STATES; i++) {
    float *a = (float*)malloc(NUM_ACTS * sizeof(float));
    for(int j=0; j < NUM_ACTS; j++) {
        a[j] = 0.0f;
    }
    q[i] = a;
}

然后上面的printf語句出現在代碼中。

我加入malloc的原因是因為根據我的理解, SIGSEGV與形成不良的malloc調用有關。 因此,如果數組初始化是造成問題的原因,我想知道:

  • 為什么?
  • 如何更改malloc代碼來解決這個問題?

我已經包含了OS X生成的崩潰日志,以防萬一可以幫助任何人。

Process:         pole [5453]
Path:            {REDACTED}
Identifier:      pole
Version:         ??? (???)
Code Type:       X86-64 (Native)
Parent Process:  bash [5441]

Date/Time:       2009-12-08 11:38:38.358 -0600
OS Version:      Mac OS X 10.6.2 (10C540)
Report Version:  6

Interval Since Last Report:          130074 sec
Crashes Since Last Report:           68
Per-App Crashes Since Last Report:   63
Anonymous UUID:                      CA20CF15-8C46-4C85-A793-6C69F9F40140

Exception Type:  EXC_BAD_ACCESS (SIGSEGV)
Exception Codes: KERN_INVALID_ADDRESS at 0x0000000100074f3b
Crashed Thread:  0  Dispatch queue: com.apple.main-thread

Thread 0 Crashed:  Dispatch queue: com.apple.main-thread
0   libSystem.B.dylib               0x00007fff828d489e __Balloc_D2A + 164
1   libSystem.B.dylib               0x00007fff828d49b8 __d2b_D2A + 45
2   libSystem.B.dylib               0x00007fff828e8c74 __dtoa + 320
3   libSystem.B.dylib               0x00007fff828aa960 __vfprintf + 4980
4   libSystem.B.dylib               0x00007fff828ec7db vfprintf_l + 111
5   libSystem.B.dylib               0x00007fff828ec75e fprintf + 196
6   pole                            0x00000001000028b5 Balance::sarsa() + 187
7   pole                            0x0000000100002e54 main + 49
8   pole                            0x00000001000010a8 start + 52

Thread 0 crashed with X86 Thread State (64-bit):
  rax: 0x0000000000000001  rbx: 0x000000010042cca0  rcx: 0x000000010042cca8  rdx: 0x0000000100074f3b
  rdi: 0x000000000000000e  rsi: 0x00007fff5fbfecbc  rbp: 0x00007fff5fbfeba0  rsp: 0x00007fff5fbfeb90
   r8: 0x00007fff5fbff0b0   r9: 0x0000000000000000  r10: 0x00000000ffffffff  r11: 0x000000010083a40b
  r12: 0x0000000000000001  r13: 0x00007fff5fbfecb8  r14: 0x00007fff5fbfecbc  r15: 0x000000010000363e
  rip: 0x00007fff828d489e  rfl: 0x0000000000010202  cr2: 0x0000000100074f3b

Binary Images:
       0x100000000 -        0x100003fff +pole ??? (???)  {REDACTED}
    0x7fff5fc00000 -     0x7fff5fc3bdef  dyld 132.1 (???)  /usr/lib/dyld
    0x7fff81697000 -     0x7fff8169bff7  libmathCommon.A.dylib ??? (???)  /usr/lib/system/libmathCommon.A.dylib
    0x7fff8289c000 -     0x7fff82a5aff7  libSystem.B.dylib ??? (???)  /usr/lib/libSystem.B.dylib
    0x7fff83c4c000 -     0x7fff83cc9fef  libstdc++.6.dylib ??? (???)  /usr/lib/libstdc++.6.dylib
    0x7fffffe00000 -     0x7fffffe01fff  libSystem.B.dylib ??? (???)  /usr/lib/libSystem.B.dylib

Model: MacBookPro4,1, BootROM MBP41.00C1.B03, 2 processors, Intel Core 2 Duo, 2.4 GHz, 2 GB, SMC 1.27f2
Graphics: NVIDIA GeForce 8600M GT, GeForce 8600M GT, PCIe, 256 MB
Memory Module: global_name
AirPort: spairport_wireless_card_type_airport_extreme (0x14E4, 0x8C), Broadcom BCM43xx 1.0 (5.10.91.19)
Bluetooth: Version 2.2.4f3, 2 service, 1 devices, 1 incoming serial ports
Network Service: AirPort, AirPort, en1
Serial ATA Device: Hitachi HTS542520K9SA00, 186.31 GB
Parallel ATA Device: MATSHITADVD-R   UJ-867
USB Device: Built-in iSight, 0x05ac  (Apple Inc.), 0x8502, 0xfd400000
USB Device: Apple Internal Keyboard / Trackpad, 0x05ac  (Apple Inc.), 0x0230, 0x5d200000
USB Device: IR Receiver, 0x05ac  (Apple Inc.), 0x8242, 0x5d100000
USB Device: BRCM2046 Hub, 0x0a5c  (Broadcom Corp.), 0x4500, 0x1a100000
USB Device: Bluetooth USB Host Controller, 0x05ac  (Apple Inc.), 0x820f, 0x1a110000

謝謝。

您的代碼中的其他地方有一個與printf語句無關的錯誤。 你正在某個地方踩內存,但是直到printf試圖用__BAlloc_D2A分配一些內存__BAlloc_D2A ,因為它用來跟蹤空閑內存塊的堆數據結構已經損壞,因此崩潰了。

為了嘗試檢測你在內存上踩踏的地方,有很多工具可用。 如果您使用的是Linux,我建議使用valgrind ,它基本上在虛擬機中運行您的代碼並告訴您何時執行任何非法操作,例如讀/寫內存超出范圍,讀取未初始化的變量等等。但是,它不可用在Mac OS X中(尚未)。

一種選擇是使用libgmalloc

% cat gmalloctest.c
#include <stdlib.h>
#include <stdio.h>

main()
{
  unsigned *buffer = (unsigned *)malloc(sizeof(unsigned) * 100);
  unsigned i;

  for (i = 0; i < 200; i++) {
    buffer[i] = i;
  }

  for (i = 0; i < 200; i++) {
     printf ("%d  ", buffer[i]);
  }
}

% cc -g -o gmalloctest gmalloctest.c
% gdb gmalloctest
Reading symbols for shared libraries .. done
(gdb) set env DYLD_INSERT_LIBRARIES /usr/lib/libgmalloc.dylib
(gdb) r
Starting program: gmalloctest
Reading symbols for shared libraries .. done
GuardMalloc: Allocations will be placed on 16 byte boundaries.
GuardMalloc:  - Some buffer overruns may not be noticed.
GuardMalloc:  - Applications using vector instructions (e.g., SSE or Altivec) should work.
GuardMalloc: GuardMalloc version 19

Program received signal EXC_BAD_ACCESS, Could not access memory.
Reason: KERN_PROTECTION_FAILURE at address: 0xb000d000
0x00001f65 in main () at gmalloctest.c:10
10          buffer[i] = i;
(gdb) print i
$1 = 100
(gdb) where
#0  0x00001f65 in main () at gmalloctest.c:10
(gdb)

另請參閱啟用Malloc調試功能

您可能有指針算術錯誤或緩沖區溢出,這會產生打破printf的副作用。

嘗試注釋掉大部分代碼( printf除外)並查看它是否崩潰。 如果沒有,那么一點一點地發表評論,直到你得到崩潰。 你會知道問題出在哪里。

此外,如果您使用的是Linux或任何unix變體,請查看使用valgrind

編輯:

我在錯誤報告中看到了這一點:

0   libSystem.B.dylib               0x00007fff828d489e __Balloc_D2A + 164

這就是實際崩潰的地方,這似乎是一個低級別的分配例程。 我猜你有一個緩沖區溢出,這會破壞空閑列表,使某些未來的分配中斷(例如在這個printf中)。

當您訪問未映射到任何內容的虛擬地址或以不允許的方式訪問地址時(例如,嘗試寫入只讀區域),SIGSEGV會發生。 如您所說,分段錯誤可能與堆損壞有關。 這是因為在內部,大多數malloc實現將簿記信息與堆上的已分配數據交錯。 如果該簿記信息被破壞,則malloc的行為未定義。 在程序的更晚版本之前,您可能看不到任何錯誤。

在這種情況下, printf可能在內部分配一些內存,這會觸發故障。 解決此問題的最佳方法可能是使用valgrind運行程序,它會在發生任何堆損壞時立即通知您。

第一個可能性是你只是普通的malloc()為你的數組提供了足夠的內存,而printf()嘗試使用malloc()多一點,並且失敗了。 我認為這不太可能。

第二個可能性是你的printf()並不像你所展示的那么簡單,而是一些相當復雜的多級指針表達式,而且這個表達式在某處變得很瘋狂。

printf的某些實現在處理“%f”時執行malloc。 如果它正在執行此操作,那么如果您在某個時刻溢出內存(即寫入超過分配結束),則printf可以嘗試進行分配並發現堆已損壞並拋出錯誤...

只是一個想法。

編輯:它可能值得看看你的狀態數組是如何填充的...其他2看起來很好但是你可以在任何地方寫出結尾...

printf("%f", parm)期望參數為double。 你的f是一個浮點數,它被隱式轉換為double。

也許隱含的轉換搞砸了???

嘗試顯式轉換

float f = 0.5f;
printf("%f\n",(double)f);

甚至

float f = 0.5f;
double ff = f;
printf("%f\n",ff);

只是一個猜測,但你做過#include <stdlib.h> 如果沒有范圍內的malloc()原型,編譯器會假定malloc()返回int ,這顯然不是真的。

如果我是對的(即使不是這樣),它暴露了一個不在C中轉換malloc()的返回值的原因。注意,如果你正在編寫C和C ++的代碼,你需要,但對於純C,不要不要轉換malloc()的返回值,讓編譯器為你做正確的事。

所以,而不是:

T *data = (T *) malloc(sz * sizeof(T));

改為:

#include <stdlib.h>
...
T *data = malloc(sz * sizeof *data);

這里, T是任何類型。 優點是:

  1. 如果忘記#include <stdlib.h> ,編譯器會抱怨,
  2. 如果更改data類型,則malloc()調用不需要更改,並且
  3. 我認為它更容易閱讀,更不容易出錯。

通過強制轉換malloc()的返回值,您不會讓編譯器有機會警告您缺少stdlib.h包含。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM