Skip to content
DarkKaiser의 블로그
DarkKaiser의 블로그
  • 개발 관련 자료(노션)
  • Raspberry Pi(노션)
  • WD My Cloud(노션)
  • GitHub
DarkKaiser의 블로그

URL을 파싱하자

DarkKaiser, 2007년 7월 17일2023년 9월 6일

1. 요약

AfxParseURL()을 이용하여 URL을 파싱할 수 있다.

2. 본문

AfxParseURL()은 URL을 파싱하기위한 MFC 함수입니다. 사용법은 AfxParseURL의 인자로 URL의 문자열을 입력하면 서버와 프로토콜과 포트를 파싱해서 넘겨줍니다.

BOOL AFXAPI AfxParseURL( LPCTSTR pstrURL, DWORD& dwServiceType, CString& strServer, CString& strObject, INTERNET_PORT& nPort );

여기까지만 하면 너무 허전하죠… 그래서 MFC를 쓰지않는 프로그램에서는 이런 기능을 구현하기 위해 MFC소스를 분석해 보겠습니다.

BOOL AFXAPI AfxParseURL(LPCTSTR pstrURL, DWORD& dwServiceType, CString& strServer,
                        CString& strObject, INTERNET_PORT& nPort) 
{ 
    dwServiceType = AFX_INET_SERVICE_UNK;
    ASSERT(pstrURL != NULL); 
    if (pstrURL == NULL) 
        return FALSE;

    URL_COMPONENTS urlComponents; 
    memset(&urlComponents, 0, sizeof(URL_COMPONENTS)); 
    urlComponents.dwStructSize = sizeof(URL_COMPONENTS);

    urlComponents.dwHostNameLength = INTERNET_MAX_URL_LENGTH; 
    urlComponents.lpszHostName = strServer.GetBuffer(INTERNET_MAX_URL_LENGTH+1); /* ④ */ 
    urlComponents.dwUrlPathLength = INTERNET_MAX_URL_LENGTH; 
    urlComponents.lpszUrlPath = strObject.GetBuffer(INTERNET_MAX_URL_LENGTH+1); /* ⑤ */

    BOOL bRetVal = _AfxParseURLWorker(pstrURL, &urlComponents, dwServiceType, nPort,
                                      ICU_BROWSER_MODE); /* 이게 진짜 */

    strServer.ReleaseBuffer(); 
    strObject.ReleaseBuffer(); 
    return bRetVal; 
}

소스를 보시면 아시겠지만 구조체를 초기화 한다음에 _AfxParseURLWorker에서 모든 처리를 하게한 느낌을 줍니다. 그럼 _AfxParseURLWorker를 한번 보죠.

AFX_STATIC BOOL AFXAPI _AfxParseURLWorker(LPCTSTR pstrURL, 
              LPURL_COMPONENTS lpComponents, DWORD& dwServiceType, 
              INTERNET_PORT& nPort, DWORD dwFlags) 
{ 
    /* this function will return bogus stuff if lpComponents */ 
    /* isn't set up to copy the components */

    ASSERT(lpComponents != NULL && pstrURL != NULL); 
    if (lpComponents == NULL || pstrURL == NULL) 
        return FALSE; 
    ASSERT(lpComponents->dwHostNameLength == 0 || 
        lpComponents->lpszHostName != NULL); 
    ASSERT(lpComponents->dwUrlPathLength == 0 || 
        lpComponents->lpszUrlPath != NULL); 
    ASSERT(lpComponents->dwUserNameLength == 0 || 
        lpComponents->lpszUserName != NULL); 
    ASSERT(lpComponents->dwPasswordLength == 0 || 
        lpComponents->lpszPassword != NULL);

    ASSERT(AfxIsValidAddress(lpComponents, sizeof(URL_COMPONENTS), TRUE)); /* ① */

    LPTSTR pstrCanonicalizedURL; 
    TCHAR szCanonicalizedURL[INTERNET_MAX_URL_LENGTH]; 
    DWORD dwNeededLength = INTERNET_MAX_URL_LENGTH; 
    BOOL bRetVal; 
    BOOL bMustFree = FALSE; 
    DWORD dwCanonicalizeFlags = dwFlags & 
        (ICU_NO_ENCODE | ICU_DECODE | ICU_NO_META | 
        ICU_ENCODE_SPACES_ONLY | ICU_BROWSER_MODE); 
    DWORD dwCrackFlags = dwFlags & (ICU_ESCAPE | ICU_USERNAME);

    bRetVal = InternetCanonicalizeUrl(pstrURL, szCanonicalizedURL, 
        &dwNeededLength, dwCanonicalizeFlags); /* ② */

    if (!bRetVal) 
    { 
        if (::GetLastError() != ERROR_INSUFFICIENT_BUFFER) 
            return FALSE;

        pstrCanonicalizedURL = new TCHAR[dwNeededLength]; 
        bMustFree = TRUE; 
        bRetVal = InternetCanonicalizeUrl(pstrURL, pstrCanonicalizedURL, 
            &dwNeededLength, dwCanonicalizeFlags); 
        if (!bRetVal) 
        { 
            delete [] pstrCanonicalizedURL; 
            return FALSE; 
        } 
    } 
    else 
        pstrCanonicalizedURL = szCanonicalizedURL;

    /* now that it's safely canonicalized, crack it */

    bRetVal = InternetCrackUrl(pstrCanonicalizedURL, 0, 
        dwCrackFlags, lpComponents); /* ③ */ 
    if (bMustFree) 
        delete [] pstrCanonicalizedURL;

    /* convert to MFC-style service ID */

    if (!bRetVal) 
        dwServiceType = AFX_INET_SERVICE_UNK; 
    else 
    { 
        nPort = lpComponents->nPort; 
        switch (lpComponents->nScheme) 
        { 
        case INTERNET_SCHEME_FTP: 
            dwServiceType = AFX_INET_SERVICE_FTP; 
            break;

        case INTERNET_SCHEME_GOPHER: 
            dwServiceType = AFX_INET_SERVICE_GOPHER; 
            break;

        case INTERNET_SCHEME_HTTP: 
            dwServiceType = AFX_INET_SERVICE_HTTP; 
            break;

        case INTERNET_SCHEME_HTTPS: 
            dwServiceType = AFX_INET_SERVICE_HTTPS; 
            break;

        case INTERNET_SCHEME_FILE: 
            dwServiceType = AFX_INET_SERVICE_FILE; 
            break;

        case INTERNET_SCHEME_NEWS: 
            dwServiceType = AFX_INET_SERVICE_NNTP; 
            break;

        case INTERNET_SCHEME_MAILTO: 
            dwServiceType = AFX_INET_SERVICE_MAILTO; 
            break;

        default: 
            dwServiceType = AFX_INET_SERVICE_UNK; 
        } 
    }

    return bRetVal; 
}

죄송합니다. 너무 길군요. 이렇게 긴것 같지 않았는데. ^ ^ㆀ

①에서 AfxIsValidAddress()를 이용하여 값이 유효한지 확인합니다.

AfxIsValidAddress()가 마치 URL이 옳바르게 쓰여는지 검사하는것 같은 분위기를 풍기는데 그냥 IsBadReadPtr()만 사용하여 메모리가 유효한지만 검사합니다.

②에서 InternetCanonicalizeUrl()를 통하여 URL이 정돈됩니다.

③에서 InternetCrackUrl()를 이용하여 실질적인 파싱을하는데 URL_COMPONENTS 라는 구조체를 이용했습니다. 그리고 나서 그냥 끝인데… 그럼 다시 AfxParseURL() 소스로 돌아가서 값이 어떻게 넘겨지는지 봐야겠습니다.

④에서 서버명을 그리고 ⑤에서 객체(파일)명의 CString 객체의 버퍼를 지정한것을 알 수 있습니다. 이렇게 분석을 해보니 우리가 이런 역활을 하는 프로그램을 만드는데 필요한것은 결국 InternetCrackUrl()뿐이군요. ^ ^

C/C++/VC++ AfxParseURLURL

글 내비게이션

Previous post
Next post

답글 남기기 응답 취소

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

최신 글

  • AssertJ 소개testCompile ‘org.assertj:assertj-core:3.6.2’ 2017년 9월 14일
  • 자주 사용되는 Lombok 어노테이션 2017년 9월 14일
  • 유니코드 #3 2017년 9월 14일
  • 유니코드 #2 2017년 9월 14일
  • 유니코드 #1 2017년 9월 14일

최신 댓글

    카테고리

    • 개인 자료 (1)
      • 일기 (1)
    • 주절주절 (7)
    • 프로그래밍 갤러리 (16)
    • 프로그래밍 언어 (186)
      • Java (29)
      • C/C++/VC++ (114)
      • C# (11)
      • Visual Basic (6)
      • 안드로이드 (9)
      • Objective-C (5)
      • JavaScript (4)
      • JSP/Servlet (2)
      • Python (4)
      • 어셈블러 (1)
    • 개발++ (44)
      • Book (11)
        • Joel On Software (10)
      • 프로젝트 관리 (6)
      • Maven (1)
      • 디버깅 (1)
      • DirectX (1)
      • Silverlight (1)
      • RESTful (1)
      • Hacking (1)
      • WDM (4)
      • VoIP (5)
      • 기타 (1)
    • 개발 도구 (15)
      • eclipse (14)
      • Sublime Text (1)
    • 네트워크 (7)
    • 설치 및 배포 (7)
      • InstallShield (2)
      • NSIS (4)
    • 버전 관리 (9)
      • Git (2)
      • CVS (2)
      • Subversion (5)
    • 데이터베이스 (7)
      • Oracle (3)
      • Sybase (2)
      • MS-SQL (2)
    • 단위테스트 (3)
      • JUnit (1)
      • NUnit (2)
    • 버그추적시스템 (2)
      • mantis (2)
    • 운영체제 (7)
      • Windows (5)
      • 리눅스 (2)
    • WAS (3)
      • WebLogic (3)
    • 디자인패턴 (1)
    • 디지털 이미지 프로세싱 (16)

    태그

    AutoExp.dat CppUnit CreateFile CVS Detours Generic ignore파일 Installer Isolation level LogCat OSI OSI 7 layer PRODUCTION_MODE request RunInstaller Runnable SafeInt session setPoperty startWebLogic.cmd STL synchronized TAB time_t VC Vector VS2005 날짜 디버깅 리치에디트컨트롤 매핑모드 문서화 주석 변환 사설 IP 성능 주석 트랜젝션 트리 프로젝트관리 프로파일러 픽셀 형변환 형식 확장자 히스토그램

    메타

    • 로그인
    • 엔트리 피드
    • 댓글 피드
    • WordPress.org
    ©2025 DarkKaiser의 블로그 | WordPress Theme by SuperbThemes