Работа со строками в С. Примеры.
Предыдущая тема урока была посвящена строковым функциям, эта тема посвящается
работе с ними.
Определение длины строк.
Длина строки определяется просто. Для этого нужно передать строковый
указатель функции strlen(), которая возвратит длину строки, выраженную в
символах. После объявления
char *с = "Any old string....";
int len;
|
следующий оператор установит переменную len равной длине строки,
адресуемой указателем с:
пример использования функции strlen().
#include <stdio.h>
#include <string.h>
#include <iostream>
using namespace std;
const int MAXLEN=256;
void main()
{
char string[MAXLEN]; /* Место для 255 символов. */
cout << "Input string:: ";
gets(string);
cout <<"\n";/* Начать новую строку. */
cout << "String: " << string << "\n";
cout << "Length = " << strlen(string);
}
|
Здесь определяется строковая переменная с именем string для приема
ввода от функции gets(). После того как вы введете строку, программа
передаст переменную string функции strlen(), которая вычислит
длину строки в символах.
В функцию strlen() можно передавать и другие виды строк. Например, вы
можете определить и инициализировать символьный буфер следующим образом:
char buffer[128] = "Copy in buffer"; |
Затем используйте функцию strlen() для установки целой переменной
len, равной числу символов в литеральной строке, скопированной в
буфер:
int len; /* Определить целую переменную. */
len = strlen(buffer); /* Вычислить длину строки. */
|
Копирование строк.
Оператор присваивания для строк не определен. Если с1 и с2 - символьные
массивы, вы не сможете скопировать один в другой следующим образом:
Но если с1 и с2 объявить как указатели типа char *,
компилятор согласится с этим оператором, но вряд ли вы получите ожидаемый
результат. Вместо копирования символов из одной строки в другую оператор с1 =
с2 скопирует указатель с2 в указатель с1, перезаписав, таким образом, адрес
в с1, потенциально потеряв информацию, адресуемую указателем.
char*с1 = new char [10];
char*с2 = new char [10];
c1=c2;// память выделенная под с1 - потерялась
|
Чтобы скопировать одну строку в другую, вместо использования оператора
присваивания вызовите функцию копирования строк strcpy(). Для двух
указателей с1 и с2 типа char * оператор
копирует символы, адресуемые указателем с2, в память, адресуемую
указателем с1, включая завершающие нули. И только на вас лежит
ответственность за то, что принимающая строка будет иметь достаточно места для
хранения копии.
Аналогичная функция strncpy() ограничивает количество копируемых
символов. Если источник (source) и приемник (destination) являются
указателями типа char * или символьными массивами, то оператор
strncpy(destination, source, 10); |
скопирует до 10 символов из строки, адресуемой указателем source, в
область памяти, адресуемую указателем destination. Если строка
source имеет больше 10 символов, то результат усекается. Если же меньше -
неиспользуемые байты результата устанавливаются равными нулю.
Примечание: Строковые функции, в имени которых
содержится дополнительная буква n, объявляют числовой параметр, ограничивающий
некоторым образом действие функции. Эти функции безопаснее, но медленнее, чем их
аналоги, не содержащие букву n. Программные примеры содержат следующие пары
функций: strcpy() и strncpy(), strcat() и strncat(),
strcmp() и strncmp().
Конкатенация строк.
Конкатенация двух строк означает их сцепление, при этом создается
новая, более длинная строка. При объявлении строки
char original[128] = "Test "; |
оператор
strcat(original, " one, two, three!"); |
превратит значение первоначальной строки original в "Test one, two,
three!"
При вызове функции strcat() убедитесь, что первый аргумент типа
char * инициализирован и имеет достаточно места, чтобы запомнить
результат. Если c1 адресует строку, которая уже заполнена, а c2
адресует ненулевую строку, оператор strcat(c1, c2); перезапишет конец
строки, вызвав серьезную ошибку.
Функция strcat() возвращает адрес результирующей строки (совпадающий с ее
первым параметром) и может использоваться как каскад нескольких вызовов
функций:
Следующий пример показывает, как можно использовать функцию strcat()
для получения в одной строке фамилии, имени и отчества, хранящихся отдельно,
например, в виде полей базы данных. Введите фамилию, имя и отчество. Программа
сцепит введенные вами строки и отобразит их как отдельную строку.
#include <iostream>
#include <string.h>
using namespace std;
void main()
{
//Резервирование места для ввода трех строк.
char *fam = new char[128];
char *im = new char[128];
char *otch = new char[128];
//Ввод данных.
cout << "Enter" << "\n";
cout << "\tSurname: ";
cin >> fam;
cout << "\tName: ";
cin >> im;
cout << "\tLastname: ";
cin >> otch;
//Резервирование места для результата.
//Нужно учесть два пробела и результирующий
//нулевой символ.
char *rez=new char[strlen(fam)+strlen(im)+strlen(otch)+3];
//"Сборка" результата.
strcat(strcat(strcpy(rez,fam)," "),im);
strcat(strcat(rez," "),otch);
//Возврат памяти в кучу.
delete [] fam;
delete [] im;
delete [] otch;
//Вывод результата.
cout << "\nResult: " << rez;
delete [] rez;
}
|
Приведенная программа демонстрируют важный принцип конкатенации строк: всегда
инициализируйте первый строковый аргумент. В данном случае символьный массив
rez инициализируется вызовом функции strcpy(), которая вставляет
fam в rez. После этого программа добавляет пробелы и две другие
строки - im и otch. Никогда не вызывайте функцию strcat() с
неинициализированным первым аргументом.
Если вы не уверены в том, что в строке достаточно места для присоединяемых
подстрок, вызовите функцию strncat(), которая аналогична функции
strcat(), но требует числового аргумента, определяющего число копируемых
символов. Для строк s1 и s2, которые могут быть либо указателями
типа char *, либо символьными массивами, оператор
присоединяет максимум четыре символа из s2 в конец строки s1.
Результат обязательно завершается нулевым символом.
Существует один способ использования функции strncat(), гарантирующий
безопасную конкатенацию. Он состоит в передаче функции strncat() размера
свободной памяти строки-приемника в качестве третьего аргумента. Рассмотрим
следующие объявления:
const int MAXLEN=128
char s1[MAXLEN] = "Cat";
char s2[] = "in hat";
|
Вы можете присоединить s2 к s1, формируя строку "Cat in
hat", с помощью функции strcat():
Если вы не уверены, что в s1 достаточно места, чтобы запомнить
результат, используйте альтернативный оператор:
strncat(s1, s2, (MAXLEN-1)-strlen(s1));
|
Этот способ гарантирует, что s1 не переполнится, даже если s2
нужно будет урезать до подходящего размера. Этот оператор прекрасно работает,
если s1 - нулевая строка.
Часто программам приходится выполнять поиск в строках отдельных символов или
подстрок, особенно при проверке имен файлов на заданное расширение. Например,
после того как пользователю предложили ввести имя файла, проверяется, ввел ли он
расширение .ТХТ, и если это так, то выполняется действие, отличное от
того, какое было бы выполнено для расширения .ЕХЕ.
Возможно, вы также захотите отвергнуть все расширения, кроме определенного,
что поможет вам предотвратить ошибки, вызванные загрузкой файла данных
нежелаемого типа.
Поиск символов.
Пример использования функции strchr().
#include <iostream>
#include <string.h>
#include <stdio.h>
using namespace std;
void main()
{
char *filename = new char[128];
cout << "Enter name of file: ";
gets(filename);
cout << "\nName of file: " << filename << "\n";
if (strchr (filename,'.'))
cout << "Name has extension" << "\n";
else
strcat (filename,".TXT");
cout << "Name of file: " << filename << "\n";
delete [] filename;
}
|
Данная программа находит расширение в имени файла, выполняя поиск точки среди
символов введенной строки. (В имени файла может быть только одна точка, которая
должна предшествовать расширению, если оно имеется.) Ключевым в этой программе
является оператор
if (strchr (filename,'.'))
cout << "Name has extension" << "\n";
else
strcat (filename,".TXT");
|
Выражение strchr (filename,'.') возвращает указатель на символ точки в
строке, адресуемой указателем filename. Если такой символ не найден,
функция strchr() возвращает нуль. Поскольку ненулевые значения означают
"истину", вы можете использовать функцию strchr() в качестве
возвращающего значения "истина"/"ложь". Вы также можете применить функцию
strchr() для присваивания указателя на подстроку, начинающуюся с
заданного символа. Например, если р - указатель, объявленный как char
*, и указатель filename адресует строку TEST.ТХТ, то результат
действия оператора p=strchr(filename, '.');
Рисунок демонстрирует еще один важный момент, связанный с адресацией
указателем не полной строки, а ее части - подстроки. Такими указателями следует
пользоваться с большой осторожностью. На рисунке показана только одна строка,
TEST.ТХТ, оканчивающаяся нулевым байтом, но два указателя -
filename и p. Указатель filename адресует полную строку. А
указатель p адресует подстроку внутри того же набора символов. Строковые
функции не заботятся о байтах, которые предшествуют их первому символу. Поэтому
оператор
отображает подстроку .ТХТ так, будто она полная строковая переменная,
а не часть другой строки.
В программировании на C нет ничего необычного в использовании многих
указателей, адресующих подстроки одной и той же полной строки. Но строка,
показанная на рисунке, расположена в куче, поэтому оператор
пытаясь тем самым освободить подстроку, адресуемую указателем p, что,
несомненно, приведет к разрушению кучи, вызвав ошибку, относящуюся к разряду
трудно обнаруживаемых.
Функция strchr() отыскивает первое появление символа в строке.
Объявления и операторы
char *p;
char s[]="Abracadabra";
p = strchr(s,'a');
|
присваивают указателю p адрес первой строчной буквы 'а' в строке
"Abracadabra".
Функция strchr() рассматривает завершающий нуль строки как значащий
символ. Приняв во внимание этот факт, можно узнать адрес конца строки. Учитывая
предыдущие объявления, оператор
установит указатель p равным адресу подстроки "bra" в конце строки
"Abracadabra".
Поиск подстрок.
Кроме поиска символов в строке, вы также можете поохотиться и за подстроками.
Этот пример демонстрирует этот метод. Данная программа аналогична предыдущей, но
устанавливает расширение файла .ТХТ.
#include <iostream>
#include <string.h>
#include <stdio.h>
using namespace std;
void main()
{
char *filename = new char[128],*p;
cout << "Enter name of file: ";
gets(filename);
cout << "\nName of file: " << filename << "\n";
strupr(filename);
p = strstr (filename,".TXT");
if (p)
cout << "Name has extension" << "\n";
else
{ p = strchr (filename,'.');
if (p)
*p=NULL; //Удалить любое другое расширение.
strcat (filename,".TXT");
}
cout << "Name of file: " << filename << "\n";
delete [] filename;
}
|
Эта программа создает имя файла, которое обязательно заканчивается
расширением .ТХТ. Чтобы определить, есть ли в имени файла это расширение,
программа выполняет оператор
p = strstr (filename,".TXT"); |
Подобно strchr(), функция strstr() возвращает адрес подстроки
или нуль, если искомая строка не найдена. Если же цель будет обнаружена,
указатель p установится равным ее адресу, в данном примере - адресу точки
в подстроке .ТХТ. Поскольку расширение может быть введено и строчными
буквами, программа выполняет оператор
чтобы перед вызовом функции strstr() преобразовать буквы оригинальной
строки в прописные.
Пример также демонстрирует способ усечения строки в позиции заданного символа
или подстроки. Здесь вызывается функция strstr(), чтобы установить
указатель p равным адресу первой точки в строке filename. Если результат
этого поиска не нулевой, то выполнится оператор, который запишет вместо точки
нулевой байт:
Тем самым будет присоединен новый конец строки в том месте, где раньше
находилось расширение файла. Теперь строка готова к добавлению нового расширения
путем вызова функции strcat().